AI

他言語で感情表現も可能な音声クローンAI「OpenVoice」、対談音声から動き付きリアルアバター生成するAIモデルなど重要論文5本を解説(生成AIウィークリー) 画像
テクノロジー

他言語で感情表現も可能な音声クローンAI「OpenVoice」、対談音声から動き付きリアルアバター生成するAIモデルなど重要論文5本を解説(生成AIウィークリー)

感情を含む細かい表現が可能なAIボイスクローン技術「OpenVoice」など、生成AI最新論文の概要5つをお届けします。

GPT-4の回答を向上させる「プロンプト26の原則」、220以上の生成タスクが実行可能なマルチモーダルモデル「Unified-IO 2」など重要論文5本を解説(生成AIウィークリー) 画像
テクノロジー

GPT-4の回答を向上させる「プロンプト26の原則」、220以上の生成タスクが実行可能なマルチモーダルモデル「Unified-IO 2」など重要論文5本を解説(生成AIウィークリー)

「礼儀は不要」「モデルに質問させる」「良い解答には報酬」など、大規模言語モデルの返答が向上する「プロンプト26の原則」をはじめとする5つの生成AI論文を紹介します。

元トランプ大統領の個人弁護士、Google Bard生成のニセ判例を提出して追求受ける「本物のような文章を生成するサービスとは知らなかった」 画像
テクノロジー

元トランプ大統領の個人弁護士、Google Bard生成のニセ判例を提出して追求受ける「本物のような文章を生成するサービスとは知らなかった」

トランプ政権において、大統領の個人弁護士兼フィクサーとして活動したマイケル・コーエン氏が、12月はじめに裁判所に提出した公式書類に存在しない判例を記していたことを裁判所から追求され、それがAIで生成したものであることを認めました。

マイクロソフト、iPhone / iPad版Copilotアプリ配信開始。無料でGPT-4も利用可能、画像生成や図で説明も 画像
ガジェット

マイクロソフト、iPhone / iPad版Copilotアプリ配信開始。無料でGPT-4も利用可能、画像生成や図で説明も

マイクロソフトはApp StoreでiOS/iPadOS用の「Microsoft Copilot」アプリを配信開始しました。少し前に、Android版アプリも公開されています。

画像・音声・文書・作曲、すべてが生成AIに頼れるようになった2023年を自分の記事で振り返る(CloseBox) 画像
テクノロジー

画像・音声・文書・作曲、すべてが生成AIに頼れるようになった2023年を自分の記事で振り返る(CloseBox)

2023年(のちょっと前から)の生成AIの動きというか広がり、勢いを、自分の取り組みを中心にまとめてみました。

マイクロソフト、CopilotアプリをGoogle Playストアで配信開始 画像
テクノロジー

マイクロソフト、CopilotアプリをGoogle Playストアで配信開始

Microsoftが、Android向けのGoogle Playストアにて「Microsoft Copilot」アプリの配信を開始しました。

毎秒100枚の画像を高速生成できる「StreamDiffusion」、文章指示で複数の動く3Dキャラを生成するNVIDIA開発「AYG」など重要論文5本を解説(生成AIウィークリー) 画像
テクノロジー

毎秒100枚の画像を高速生成できる「StreamDiffusion」、文章指示で複数の動く3Dキャラを生成するNVIDIA開発「AYG」など重要論文5本を解説(生成AIウィークリー)

生成AIの重要論文5本解説する連載。今回は、毎秒100枚という画像高速生成できると話題を呼んだ「StreamDiffusion」、文章指示で複数の動く3Dキャラを生成するNVIDIAの4Dアニメーションツール「AYG」などを紹介しています。

AIが商用サイトを作ってくれるサービスSolo、Mozillaがベータ開始。SNSやリンクから文章作成、フリー画像挿入に公開まで。実際に試した結果 画像
テクノロジー

AIが商用サイトを作ってくれるサービスSolo、Mozillaがベータ開始。SNSやリンクから文章作成、フリー画像挿入に公開まで。実際に試した結果

Mozillaは、基本的な情報を入力するとAIが自動的にWebサイトのデザインを作成し、Webサイトの公開まで可能なサービス「Solo」を公開しました。

アップル、独自生成AI「Apple GPT」のため出版社や報道機関とライセンス交渉中? NY Timesほか報道 画像
テクノロジー

アップル、独自生成AI「Apple GPT」のため出版社や報道機関とライセンス交渉中? NY Timesほか報道

アップルは表立って生成系AI競争には加わっていませんが、水面下ではAIモデルを訓練するため、ニュース報道機関に「少なくとも5000万ドル相当の複数年契約」を持ちかけたと米The New YorkTimesが報じています。

ビー玉迷路ゲームを爆速クリアするAIロボ「CyberRunner」 人間超えスキル習得、ショートカットのチートも発見 画像
テクノロジー

ビー玉迷路ゲームを爆速クリアするAIロボ「CyberRunner」 人間超えスキル習得、ショートカットのチートも発見

AIは、チェスのようなボードゲームではすでに人間よりも強くなっています。これはさほど驚くことではありませんが、そこに反射神経や手先の細かな操作が必要になるゲームだったらどうでしょうか。

Microsoft Copilot(とSuno AIプラグイン)だけで無料曲作り。チャットだけで超簡単に作曲するやりかた教えます(CloseBox) 画像
テクノロジー

Microsoft Copilot(とSuno AIプラグイン)だけで無料曲作り。チャットだけで超簡単に作曲するやりかた教えます(CloseBox)

Suno AIよりさらに簡単に完成曲を作れるようになりました。Microsoft Copilotで作曲する方法とその制限事項などについて調べました。

GoogleのAI『Bard』がGmailやGoogleマップ、YouTube等と連携。地図やメール本文を調べて回答が可能に 画像
テクノロジー

GoogleのAI『Bard』がGmailやGoogleマップ、YouTube等と連携。地図やメール本文を調べて回答が可能に

Googleは12月19日、試験運用中の生成AIチャット「Bard」で、GmailやGoogleドキュメント、Googleドライブ、YouTube、GoogleマップなどのGoogleサービスと連携できる「Bard拡張機能」が日本でも利用可能になったと発表しました。

作曲 AIの「Suno」がMicrosoft Copilotに統合。現在分かっていること(CloseBox) 画像
テクノロジー

作曲 AIの「Suno」がMicrosoft Copilotに統合。現在分かっていること(CloseBox)

マイクロソフトは12月20日、作詞・作曲・演奏・歌唱まで可能なAI作曲サービス「Suno」を自社のAIプラットフォームであるWindows Copilotに統合すると発表しました。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第15回:SDXLでのControlNet活用方法その2+ 衣服を固定できるOutfit Anyone (西川和久) 画像
テクノロジー

生成AIグラビアをグラビアカメラマンが作るとどうなる?第15回:SDXLでのControlNet活用方法その2+ 衣服を固定できるOutfit Anyone (西川和久)

連載第13回目ではControlNetのCanny、Depth、OpenPoseをご紹介した。続きに入る前に軽くおさらいすると、ControlNetは指定した画像を使って、構図や絵柄、ポーズ、そして書かれている内容(Prompt相当)などを抽出し、生成する画像を固定する方法だ。

AIで作曲して演奏・歌唱してくれる「Suno」、MIDIで吐いてくれPleaseとお嘆きの方に。無料のもあるよ(CloseBox) 画像
テクノロジー

AIで作曲して演奏・歌唱してくれる「Suno」、MIDIで吐いてくれPleaseとお嘆きの方に。無料のもあるよ(CloseBox)

歌詞を与えれば作曲・演奏・歌唱と残りの全てをやってくれるAI作曲完パケサービス「Suno」ですが、音楽制作界隈では「MIDIで吐いてくれ」との声が多く上がっています。

「Suno」と一味違う音楽生成AI登場。音楽から新しい音楽をパート毎に生成「StemGen」、着せ替えAI「Outfit Anyone」など重要論文5本を解説(生成AIウィークリー) 画像
テクノロジー

「Suno」と一味違う音楽生成AI登場。音楽から新しい音楽をパート毎に生成「StemGen」、着せ替えAI「Outfit Anyone」など重要論文5本を解説(生成AIウィークリー)

音楽生成に新たな展開が。Music to Musicによる生成をパートごとに出せる技術が登場しています。生成AIに関する論文5つを紹介します。

作曲歌唱AI「Suno」、今からでも間に合う制作マニュアル。やり方がちょっと変わったので(CloseBox) 画像
テクノロジー

作曲歌唱AI「Suno」、今からでも間に合う制作マニュアル。やり方がちょっと変わったので(CloseBox)

AI作曲サービスSunoのUIがガラリと変わったので、使い方をまとめてみました。

AI作曲でマルチモーダル活用。Suno + ChatGPT + Stable Diffusionを連携させたらエモくなった(CloseBox) 画像
テクノロジー

AI作曲でマルチモーダル活用。Suno + ChatGPT + Stable Diffusionを連携させたらエモくなった(CloseBox)

Suno短期連載第3弾。Suno + ChatGPT + Stable Diffusionを連携させてAI楽曲を作る試みです。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第14回:2023年下半期まとめ+α 13回分を振り返る (西川和久) 画像
テクノロジー

生成AIグラビアをグラビアカメラマンが作るとどうなる?第14回:2023年下半期まとめ+α 13回分を振り返る (西川和久)

生成AIは技術の進歩/進化が凄まじいペースで数ヶ月前はもうかなり古い話になることもあり、今回はこれまでの13回分をまとめてみたい。 

生成AI「Suno」が作った楽曲は再利用できる? 分解して想像した、「Suno以降」の音楽制作と音楽体験(CloseBox) 画像
テクノロジー

生成AI「Suno」が作った楽曲は再利用できる? 分解して想像した、「Suno以降」の音楽制作と音楽体験(CloseBox)

Sunoで作った楽曲を音源分離し、再構築して歌ってみました。そこで、Suno以降の音楽制作と音楽体験のあり方について考えてみました。

「人のぬくもり、理解できない」AI「Suno」が作詞・作曲・演奏し、歌う美しいバラードに感動した(CloseBox) 画像
テクノロジー

「人のぬくもり、理解できない」AI「Suno」が作詞・作曲・演奏し、歌う美しいバラードに感動した(CloseBox)

感動できるボーカル曲をAIがほぼ一発で生成できるようになりました。

写真内の奥行きを推定する「Marigold」、言語に頼らず画像理解する「Large Vision Model」、数分間の高品質ビデオ作成する「Vchitect」など重要論文6本を解説(生成AIウィークリー) 画像
テクノロジー

写真内の奥行きを推定する「Marigold」、言語に頼らず画像理解する「Large Vision Model」、数分間の高品質ビデオ作成する「Vchitect」など重要論文6本を解説(生成AIウィークリー)

今週は重要論文が多くて6本です。画像の深度情報を推定する技術を大幅に進化させた「Marigold」などの生成AIの最新情報をお届けします。

Googleの新AIモデル「Gemini」。Ultraすごいマルチモーダルデモの種明かし(Google Tales) 画像
テクノロジー

Googleの新AIモデル「Gemini」。Ultraすごいマルチモーダルデモの種明かし(Google Tales)

動画がすごすぎると話題を呼んだGoogle Gemini Ultraですが……。

Meta、AIで写真の上下を生成して縦長にする機能・画像生成AIのウェブサービスなど公開。見えない電子透かしを追加 画像
テクノロジー

Meta、AIで写真の上下を生成して縦長にする機能・画像生成AIのウェブサービスなど公開。見えない電子透かしを追加

Metaは12月6日(現地時間)、同社の画像生成AI「Imagine」のウェブ版(imagine.meta.com)を公開しました。サイトは日本語化されていますが、残念ながらいまのところ利用できるのは米国のみとなっています。

Google Pixel向け12月Feature Drop発表。動画ブーストやっと提供、Pixel 8 Proは初のGemini Nano対応スマホに 画像
ガジェット

Google Pixel向け12月Feature Drop発表。動画ブーストやっと提供、Pixel 8 Proは初のGemini Nano対応スマホに

Googleは12月6日(現地時間)、新しいAIモデル「Gemini」を発表しました。用途に応じてUltra、Pro、Nanoという3つのバージョンが用意されており、その中でモバイル機器向けとなるGemini NanoをPixel 8 Proに展開することも発表されています。

Google、新AIモデル「Gemini」発表。動画もネイティブに理解するマルチモーダル、Pixel 8 Proにも導入へ 画像
テクノロジー

Google、新AIモデル「Gemini」発表。動画もネイティブに理解するマルチモーダル、Pixel 8 Proにも導入へ

日本時間12月7日、Googleは新開発のAIモデル「Gemini」を発表しました。モバイル機器からデータセンターまで、あらゆる用途に対応すべく、Gemini Ultra、Gemini Pro、Gemini Nanoの3種類を用意しています。

AIで「普通のおじさん」を生成したフェイク新聞の作り方。そこから考える「普通」への疑い 画像
テクノロジー

AIで「普通のおじさん」を生成したフェイク新聞の作り方。そこから考える「普通」への疑い

生成AIの出力画像を元にCGで作った新聞っぽいフェイク画像をXに投稿したところ、想像以上の反響がありました。気軽な実験のつもりで説明も雑過ぎたため、伝わりにくかったり誤解されたりした部分もあるようです。どのように、なぜ作ったのか補足します。

マイクロソフトのSeeing AIアプリ、Android向けにもリリース。スマホカメラを向けると周囲の様子を音声で説明 画像
テクノロジー

マイクロソフトのSeeing AIアプリ、Android向けにもリリース。スマホカメラを向けると周囲の様子を音声で説明

Microsoftは12月4日(現地時間)、国際障害者デー(12月3日)を記念して、スマートフォンのカメラを向けたものを音声で説明するアプリ「Seeing AI」のAndroid版をリリースしました。

画像内のキャラを思うがままに抜群の精度で動かせる「Animate Anyone」、話した声をすぐに翻訳するMeta「Seamless」など重要論文5本を解説(生成AIウィークリー) 画像
テクノロジー

画像内のキャラを思うがままに抜群の精度で動かせる「Animate Anyone」、話した声をすぐに翻訳するMeta「Seamless」など重要論文5本を解説(生成AIウィークリー)

先週大きな話題となった、画像内のキャラクターや写真内の人物を骨格動画に応じて動かせる「Animate Anyone」など5本の生成AI論文を紹介。

AI咀嚼音キャンセラー「ドリトス・サイレント」フリトレーが発表。通話音声からスナック菓子を食べる音を除去 画像
ゲーム

AI咀嚼音キャンセラー「ドリトス・サイレント」フリトレーが発表。通話音声からスナック菓子を食べる音を除去

スナック菓子「ドリトス」を製造販売するフリトレーは、ゲームのボイスチャット(VC)やZoomその他のビデオ・音声会議などの通話音声に自分の咀嚼音が乗らないようにする、モグモグ音キャンセラーアプリ「Doritos Silent」を発表しました。

アマゾン、企業向けAIチャットボット「Q」発表。様々なビジネスソフトと連携 画像
テクノロジー

アマゾン、企業向けAIチャットボット「Q」発表。様々なビジネスソフトと連携

米アマゾンは11月28日、企業向けのAIチャットボット「Q」を発表しました。AWSの機能を熟知しており、関連サービスを利用している顧客が問題に遭遇した際に、自然言語で解決策を問い合わせることが可能になります。

AI向けに改造されたGeForce RTX 4090の写真が中国で公開。米国による輸出禁止前の駆け込み需要か 画像
ガジェット

AI向けに改造されたGeForce RTX 4090の写真が中国で公開。米国による輸出禁止前の駆け込み需要か

米国政府はAIや機械学習に使われるGPUにつき、中国への輸出規制を強化しつつあります。その範囲は次第に拡大し、ついにNVIDIAの最新GPUであるRTX 4090にまで及びました。本来はゲーム用ではありますが、非常に高い演算能力を誇り、当然AI用途にも転用できるためです。

AI再現の歴代F1王者vs.現役F1ドライバーが対決する『Lap of Legends』、2024年テレビ放映公開予定 画像
テクノロジー

AI再現の歴代F1王者vs.現役F1ドライバーが対決する『Lap of Legends』、2024年テレビ放映公開予定

米国のビールメーカーMichelob ULTRAが、名門F1チームのウィリアムズ・レーシングとのコラボレーション企画として『Lap of Legends』と称するテレビ番組を製作中であることを発表しました。

Humaneのバッジ型AIウェアラブル「Ai Pin」を注文してわかったこと。米国外で使える? アクセサリは? 画像
テクノロジー

Humaneのバッジ型AIウェアラブル「Ai Pin」を注文してわかったこと。米国外で使える? アクセサリは?

元アップル社員が開発し、OpenAIのサム・アルトマンも出資したと話題になっていたAIウェアラブルがついに発売(米国のみ)。これを購入できた五島正浩さんに、購入時の様子をレポートしてもらいました。

Inter BEEとAdobe MAXに見る、映像業界の変遷とAIへの取り組み(小寺信良) 画像
カルチャー

Inter BEEとAdobe MAXに見る、映像業界の変遷とAIへの取り組み(小寺信良)

Inter BEE 2023とAdobe MAXを取材した小寺信良さんが感じた、業界の変化とAIについて。

AIが間違えやすい「指の数」を修正する技術、Stability AIの動画生成AI「Stable Video Diffusion」など重要論文5本を解説(生成AIウィークリー) 画像
テクノロジー

AIが間違えやすい「指の数」を修正する技術、Stability AIの動画生成AI「Stable Video Diffusion」など重要論文5本を解説(生成AIウィークリー)

発表以来大きな話題となっている、Stability AIの動画生成AIモデルなど、5本の生成AI論文を解説。

GoogleのAI「Bard」、人間の代わりにYouTubeを見て内容を回答可能に。料理動画からレシピを要約も 画像
テクノロジー

GoogleのAI「Bard」、人間の代わりにYouTubeを見て内容を回答可能に。料理動画からレシピを要約も

GoogleはAIチャットボット「Bard」をアップデートし、YouTube動画を理解できる最初の一歩を踏み出したと発表しました。

スマホ版ChatGPTの音声会話機能が無料ユーザーに開放。退社したブロックマン元社長もお勧め 画像
テクノロジー

スマホ版ChatGPTの音声会話機能が無料ユーザーに開放。退社したブロックマン元社長もお勧め

OpenAIは元CEOサム・アルトマン氏の去就をめぐり大変なことになっているさなか、ChatGPTモバイルアプリの音声会話機能を無料ユーザーも利用可能にしたと発表しました。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第13回:SDXLでのControlNet活用方法その1+α版(西川和久) 画像
テクノロジー

生成AIグラビアをグラビアカメラマンが作るとどうなる?第13回:SDXLでのControlNet活用方法その1+α版(西川和久)

第9回にFooocus-MREを使ってControlNetをご紹介したが、一般的なAUTOMATIC1111での説明はまだだったので、改めて今回と次回で行いたい。

入力テキストを実写アバターに話させるツールをMicrosoftが発表、擬人化キャラの外見や性格を文章で作り出す「ChatAnything」など重要論文5本を解説(生成AIウィークリー) 画像
テクノロジー

入力テキストを実写アバターに話させるツールをMicrosoftが発表、擬人化キャラの外見や性格を文章で作り出す「ChatAnything」など重要論文5本を解説(生成AIウィークリー)

生成AIの最新トレンドを追いかける連載。今回は入力テキストを実写アバターに話させるツール、擬人化キャラの外見や性格を文章で作り出す技術など重要論文5本を解説します。

OpenAIサム・アルトマンCEOが退社、事実上の追放。取締役会「意思疎通が不誠実と判断」 画像
テクノロジー

OpenAIサム・アルトマンCEOが退社、事実上の追放。取締役会「意思疎通が不誠実と判断」

ChatGPTやDALL・E等の生成AIサービスで知られるOpenAI社が、CEOサム・アルトマン氏の退社を発表しました。

『Japanese Stable Diffusion XL』公開。日本語プロンプトで日本文化を反映した画像出力 画像
テクノロジー

『Japanese Stable Diffusion XL』公開。日本語プロンプトで日本文化を反映した画像出力

日本の文化・アートを日本語の入力で高品質に出力できる画像生成AIが、Stability AIから公開されました。