Generative AI

カルチャー 2023 Nov 27

Inter BEEとAdobe MAXに見る、映像業界の変遷とAIへの取り組み（小寺信良）

Inter BEE 2023とAdobe MAXを取材した小寺信良さんが感じた、業界の変化とAIについて。

小寺信良

テクノロジー 2023 Nov 27

AIが間違えやすい「指の数」を修正する技術、Stability AIの動画生成AI「Stable Video Diffusion」など重要論文5本を解説（生成AIウィークリー）

発表以来大きな話題となっている、Stability AIの動画生成AIモデルなど、5本の生成AI論文を解説。

山下（Seamless）

テクノロジー 2023 Nov 22

スマホ版ChatGPTの音声会話機能が無料ユーザーに開放。退社したブロックマン元社長もお勧め

OpenAIは元CEOサム・アルトマン氏の去就をめぐり大変なことになっているさなか、ChatGPTモバイルアプリの音声会話機能を無料ユーザーも利用可能にしたと発表しました。

Kiyoshi Tane

テクノロジー 2023 Nov 20

生成AIグラビアをグラビアカメラマンが作るとどうなる？第13回：SDXLでのControlNet活用方法その1+α版（西川和久）

第9回にFooocus-MREを使ってControlNetをご紹介したが、一般的なAUTOMATIC1111での説明はまだだったので、改めて今回と次回で行いたい。

西川和久

テクノロジー 2023 Nov 20

CEOを解任されたサム・アルトマン氏、OpenAI本社での写真を投稿。「もうゲストで入ることはない」の意味するところは？

OpenAIのCEOを追われたサム・アルトマン氏が「これ（OpenAIのゲストタグ）を着けるのはこれが最初で最後」という写真をXに投稿しました。

松尾公也

テクノロジー 2023 Nov 20

入力テキストを実写アバターに話させるツールをMicrosoftが発表、擬人化キャラの外見や性格を文章で作り出す「ChatAnything」など重要論文5本を解説（生成AIウィークリー）

生成AIの最新トレンドを追いかける連載。今回は入力テキストを実写アバターに話させるツール、擬人化キャラの外見や性格を文章で作り出す技術など重要論文5本を解説します。

山下（Seamless）

テクノロジー 2023 Nov 17

『Japanese Stable Diffusion XL』公開。日本語プロンプトで日本文化を反映した画像出力

日本の文化・アートを日本語の入力で高品質に出力できる画像生成AIが、Stability AIから公開されました。

松尾公也

テクノロジー 2023 Nov 17

ローコード開発ツール「Copilot Studio」発表。Copilotのカスタマイズ、プラグイン開発、ワークフロー設定などが可能に（Microsoft Ignite 2023）

マイクロソフトは開催中の年次イベント「Microsoft Ignite 2023」で、同社のAIサービスであるCopilotのカスタマイズやプラグイン開発、ワークフローの設定、データソースとの接続などを含むさまざまな開発を可能にするローコード開発ツール「Copilot Studio」を発表しました。

新野淳一

テクノロジー 2023 Nov 16

「Bing Chat」が「Copilot」にリブランディング。Edge以外のブラウザ、モバイルでも利用可能に（Microsoft Ignite 2023）

マイクロソフトはこれまで「Bing Chat」および企業向けに「Bing Chat Enterprise」の呼称で提供してきたAIサービスを「Copilot」にリブランディングし、同社のAIサービス全体の体験を「Microsoft Copilot」で統一します。

新野淳一

テクノロジー 2023 Nov 15

AIで蘇る、伝説の歌手エディット・ピアフの声と姿。伝記映画「EDITH」のナレーションも

伝説的歌手であるエディット・ピアフが遺した声を元にしたAIボイスによりナレーションが行われることが発表されました。

松尾公也

テクノロジー 2023 Nov 13

SDXLでライブ映像をリアルタイム画像生成できる高速化ツール「LCM-LoRA」、GPT-4Vより良い結果も示す画像理解モデル「CogVLM」など重要論文5本を解説（生成AIウィークリー）

今回の生成AI論文紹介では、画像の生成、理解、対話といった分野での進歩がありました。

山下（Seamless）

テクノロジー 2023 Nov 9

生成AIグラビアをグラビアカメラマンが作るとどうなる？第12回：SDXL用ModelやLoRAをピックアップ+α版。寝転びポーズや「東京駅」で撮影など (西川和久)

前回、連載11回目はSD 1.5用のModelとLoRAを主にご紹介した。12回目の今回は予告どおり、次世代 Stable Diffusion として表現力が格段に向上した SDXL用のModelとLoRA、そして+αをご紹介したい。

西川和久

テクノロジー 2023 Nov 8

AIプログラマーは24時間耐久プログラミングが好きなの？　GPT4新機能にときめいたあなたは参加したいかも（CloseBox）

AIの24時間ハッカソンの審査会を見てきたと思ったら、次の24時間耐久GPTハッカソンが開かれるという知らせが。

松尾公也

テクノロジー 2023 Nov 7

xAI、AIチャットボット「Grok」発表。Xのデータで学習、きわどい質問にユーモア交えて回答

イーロン・マスクが設立したAIベンチャーxAIが、新しいAIチャットボット「Grok」を発表しました。xAIの声明によればGrokはマスク氏が所有するSNS、「X」からのデータで強化され、他社のAIチャットボットに比べ最新の情報に関する質問にも回答できるとされています。

Munenori Taniguchi

テクノロジー 2023 Nov 6

文字起こし「Whisper」の高速化モデル「Distil-Whisper」、スマホで別人の声になりきる「LLVC」、感情付きプロンプトなど重要論文5本を解説（生成AIウィークリー）

その週の重要論文5本を解説する連載。今回は、OpenAIの文字起こし「Whisper」の高速化モデル「Distil-Whisper」、スマホで自分の声を別人の声に即時変換するモデル「LLVC」など。

山下（Seamless）

テクノロジー 2023 Nov 3

スカーレット・ヨハンソン、AI生成フェイク広告に法的措置。似せた顔と声でアプリを宣伝

俳優のスカーレット・ヨハンソンが、AI画像生成アプリ『Lisa AI: 90s Yearbook & Avatar』の広告にAI生成した自身の肖像と声が使われていることに対して法的措置を講じ、取り下げさせました。

Munenori Taniguchi

テクノロジー 2023 Nov 2

ビートルズ最後の新曲「Now And Then」はどのように現代に復活したか。公式ドキュメンタリーで分かったAIの貢献（CloseBox）

ビートルズの「新曲」が11月3日に公開されます。その制作ドキュメンタリーが本日公開され、その曲の一部を聴くことができましたので、そこでどんなことが行われていたのかをまとめ

松尾公也

テクノロジー 2023 Oct 30

画像内キャラを3D変換する強力モデル「Zero123++」、文章から高品質3Dモデル生成するAI「DreamCraft3D」など重要論文5本を解説（生成AIウィークリー）

今回は3Dモデルで大きな躍進がありました。画像1枚から3Dモデルを高品質に生成する拡散モデル「Zero123++」をはじめとする、生成AI最新論文の概要5つをお届けします。

山下（Seamless）

テクノロジー 2023 Oct 25

生成AIグラビアをグラビアカメラマンが作るとどうなる？第11回：Stable Diffusion 1.5の注目ModelやLoRAを紹介+α版 (西川和久)

ここのところ、生成AI画像環境構築やアプリの使い方などで3回、顔LoRA制作…と少し重いネタが続いたので、今回は軽めの気になるModelやLoRAを作例と共にご紹介したい。

西川和久

テクノロジー 2023 Oct 23

ベートーヴェンやクレオパトラなど、偉人になりきるAI「Character-LLM」、“グリグリ動かせる3Dシーン”をリアルタイム生成する「4D Gaussian Splatting」など重要論文5本を解説（生成AIウィークリー）

生成AIの重要論文5つを紹介する連載。今回はWeb上のサービスを言語指示でフル活用できるChrome拡張機能を用いたAI「OpenAgents」、偉人を完コピするAI「Character-LLM」など。

山下（Seamless）

テクノロジー 2023 Oct 23

Python互換言語「Mojo」、Appleシリコンにネイティブ対応したMac版が公開。Pythonの9万倍、C言語に比肩する高速性

今回のAppleシリコンにネイティブ対応したMac版のリリースは、Linux版に続くもの。Windows版のリリース時期は未定です。

新野淳一

テクノロジー 2023 Oct 18

生成AIグラビアをグラビアカメラマンが作るとどうなる？第十回：実在モデルからSDXL用顔LoRAを作る (西川和久)

Modelに無い顔や彼女の顔を出したい！

西川和久

テクノロジー 2023 Oct 17

Pythonの高速スーパーセット「Mojo」がAppleシリコン搭載Macに対応間近。Windowsより先に

Pythonのスーパーセット言語として注目されているMojoは現在Linux版のみ。次はWindows版ではなくMac版になりそうだ。

新野淳一

テクノロジー 2023 Oct 16

アップルがマルチモーダル大規模言語モデル「Ferret」を公開。画像内の形や場所を言葉で説明（生成AIウィークリー）

アップルらが開発したMultimodal Large Language Modelの「Ferret」など、5本の生成AI関連論文を紹介します。

山下（Seamless）

テクノロジー 2023 Oct 13

Google検索で直接AIによる画像生成が可能に。米国のSGE登録ユーザー対象

Googleは8月30日より、Google Search labs登録ユーザーを対象に「生成AIによる検索体験（SGE）」の提供を開始していますが、10月12日にこの機能を拡張し、SGEにオプトインしたユーザーは、通常のGoogle検索バーからAIによる画像生成を行うことが可能になりました。

Munenori Taniguchi

テクノロジー 2023 Oct 12

生成AI時代の新技術てんこ盛り。Adobe MAX 2023「Sneaks」を深掘りする（西田宗千佳）

今年も、Adobeの年次イベント「Adobe MAX 2023」の取材で米ロサンゼルスに来ている。Adobeのイベントでは多数の新技術が発表になるが、やはり「華」でありハイライトは、開発途上の技術を先出しする「Sneaks」だ。

西田宗千佳

テクノロジー 2023 Oct 11

生成AIグラビアをグラビアカメラマンが作るとどうなる？第九回：Fooocus-MREでimage-2-imageやControlNetを試す (西川和久)

■画像生成は出来たけど…何かもう一捻りしたい！

西川和久

テクノロジー 2023 Oct 9

どんなに長い文章でも破綻しない生成AI「StreamingLLM」、キャラクターの性格や話し方を模倣するAIなど重要論文5本を解説（生成AIウィークリー）

生成AIの重要論文を解説する連載。今回は、大規模言語モデルでどんなに長い文章でも破綻しない手法、キャラクターの性格や話し方を模倣するAIなど紹介します。

山下（Seamless）

テクノロジー 2023 Oct 5

Google、スマホ用マルチモーダル生成AI「アシスタント with Bard」発表。AndroidとiOS に試験提供

Googleは、日本時間10月4日夜に開催されたMade By GoogleイベントでAndroidとiOS向けの「Assistant with Bard」を発表しました。

Munenori Taniguchi

テクノロジー 2023 Oct 3

ロビン・ウィリアムズの娘ゼルダ、AI生成で再現された父の姿や声が「個人的に不快」と非難

米国の女優・監督兼プロデューサー、ゼルダ・ウィリアムズ氏は、すでに亡くなった人の遺志を考慮することなくAIで再現したり、置き換えたりする試みに対して「個人的に不快だ」と述べています。

Munenori Taniguchi

テクノロジー 2023 Oct 2

10倍高速に3Dモデル生成可能な「DreamGaussian」、ネット記事量産できる生成AI「InternLM-XComposer」など重要論文5本を解説（生成AIウィークリー）

生成AIの重要論文5本を解説する連載。今回は、3Dモデルを高速生成する「DreamGaussian」、ネット記事量産AI「InternLM-XComposer」などです。

山下（Seamless）

テクノロジー 2023 Sep 29

生成AIグラビアをグラビアカメラマンが作るとどうなる？第八回：シンプルで高機能なSDXL専用インターフェースFooocusとFooocus-MREの使いかた (西川和久)

Stable Diffusionを使う新たなインターフェース、Fooocusをご紹介したい。インストールはbat一発、起動/アップデートもbat一発、Modelも初期起動時に自動的にダウンロードと非常にシンプル。そしてなにより、出てくる絵が驚異的という優れたインターフェースなのだ。

西川和久

テクノロジー 2023 Sep 29

Metaが28人の生成AIキャラクターを発表した理由。どこまでもFacebook的なAI戦略（本田雅一）

「Meta Connect」という開発者向けイベントに参加した。なぜQuestシリーズに力を入れるのか、なぜAI技術に投資を行うのか。その答えの先には、常にSNSの存在がある。Metaにとっての生成AIとはコミュニケーションを円滑に行うための道具なのだ。

本田雅一

テクノロジー 2023 Sep 29

等身大3Dデジタルヒューマンを動かしてみたらインパクトでかかった（CloseBox）

生成AIで学習して生成した顔写真を元に、3Dデジタルヒューマンを作成し、それを等身大のアニメーションにしてみました。

松尾公也

テクノロジー 2023 Sep 26

ハリウッドの脚本家組合、ストライキ終結に向け暫定合意。生成AIやストリーミングの収益分配を巡る交渉が決着へ

全米脚本家組合(WGA)は、生成AI使用の規制や動画ストリーミングからの報酬などに関し、大手スタジオとの間で約5か月にわたるストライキを終了させるための暫定的な合意に達したと発表しました。

Munenori Taniguchi

テクノロジー 2023 Sep 25

ChatGPT、画像と音声使った会話が可能に。Plusユーザーはモバイルアプリでマルチモーダルに

OpenAIは9月25日、ChatGPTのバージョンアップを発表しました。今後2週間でロールアウトし、Plusプランのユーザーは、iOSとAndroidアプリではChatGPTと音声で会話することが可能になり、画像を含んだ会話ができるようになります。

松尾公也

テクノロジー 2023 Sep 25

実在の人物の3Dバーチャルヒューマン化、生成AIとの組み合わせでうまくいきそう（CloseBox）

生成AIを利用してバーチャルヒューマンを制作してみました。

松尾公也

テクノロジー 2023 Sep 25

生成AIグラビアをグラビアカメラマンが作るとどうなる？第七回：自分で始める環境作りとお薦め機材 / AUTOMATIC1111を動かしてみる (西川和久)

■生成AIグラビアを実際作るには！？

西川和久

テクノロジー 2023 Sep 25

数行のコード追加でStable Diffusion生成画像を高品質にする「FreeU」、Llama2を10万トークンに低コストで増やす手法「LongLoRA」など重要論文5本を解説（生成AIウィークリー）

生成AIの重要論文5本を解説。「数行のコードを足すだけ…」生成画像・動画の品質が向上「FreeU」、LLaMA2を10万トークンに低コストで増やす手法「LongLoRA」など。

山下（Seamless）

ガジェット 2023 Sep 22

Windows 11の「ペイント」大進化。26日に画像生成AIや背景除去、レイヤー機能を含むアップデート配信

米マイクロソフトは9月21日（現地時間）に開催したスペシャルイベントで、26日にWindows 11の最新アップデートを実施すると発表しました。

Kiyoshi Tane

テクノロジー 2023 Sep 22

AI画像生成ツール「DALL・E 3」発表。ChatGPTとの統合で対話的に生成し、プロンプトの理解度向上も

OpenAIが、AI画像生成ツールの新バージョン「DALL・E 3」を発表しました。DALL・E 3は、入力したテキスト文を従来より忠実に、生成するアートへ反映することが可能になっています。

Munenori Taniguchi

テクノロジー 2023 Sep 18

“好きな人の声”のオーディオブックを電子書籍から作るAI、AI画像を超高速生成する「InstaFlow」など重要論文5本を解説（生成AIウィークリー）

生成AIの注目すべき論文を解説する連載。今週は、マイクロソフトによる、“好きな人の声”のオーディオブックを電子書籍から作るAI、0.09秒で画像を生成するAI「InstaFlow」など。

山下（Seamless）

Inter BEEとAdobe MAXに見る、映像業界の変遷とAIへの取り組み（小寺信良）

AIが間違えやすい「指の数」を修正する技術、Stability AIの動画生成AI「Stable Video Diffusion」など重要論文5本を解説（生成AIウィークリー）

スマホ版ChatGPTの音声会話機能が無料ユーザーに開放。退社したブロックマン元社長もお勧め

生成AIグラビアをグラビアカメラマンが作るとどうなる？第13回：SDXLでのControlNet活用方法その1+α版（西川和久）

CEOを解任されたサム・アルトマン氏、OpenAI本社での写真を投稿。「もうゲストで入ることはない」の意味するところは？

入力テキストを実写アバターに話させるツールをMicrosoftが発表、擬人化キャラの外見や性格を文章で作り出す「ChatAnything」など重要論文5本を解説（生成AIウィークリー）

『Japanese Stable Diffusion XL』公開。日本語プロンプトで日本文化を反映した画像出力

ローコード開発ツール「Copilot Studio」発表。Copilotのカスタマイズ、プラグイン開発、ワークフロー設定などが可能に（Microsoft Ignite 2023）

「Bing Chat」が「Copilot」にリブランディング。Edge以外のブラウザ、モバイルでも利用可能に（Microsoft Ignite 2023）

AIで蘇る、伝説の歌手エディット・ピアフの声と姿。伝記映画「EDITH」のナレーションも

SDXLでライブ映像をリアルタイム画像生成できる高速化ツール「LCM-LoRA」、GPT-4Vより良い結果も示す画像理解モデル「CogVLM」など重要論文5本を解説（生成AIウィークリー）

生成AIグラビアをグラビアカメラマンが作るとどうなる？第12回：SDXL用ModelやLoRAをピックアップ+α版。寝転びポーズや「東京駅」で撮影など (西川和久)

AIプログラマーは24時間耐久プログラミングが好きなの？ GPT4新機能にときめいたあなたは参加したいかも（CloseBox）

xAI、AIチャットボット「Grok」発表。Xのデータで学習、きわどい質問にユーモア交えて回答

文字起こし「Whisper」の高速化モデル「Distil-Whisper」、スマホで別人の声になりきる「LLVC」、感情付きプロンプトなど重要論文5本を解説（生成AIウィークリー）

スカーレット・ヨハンソン、AI生成フェイク広告に法的措置。似せた顔と声でアプリを宣伝

ビートルズ最後の新曲「Now And Then」はどのように現代に復活したか。公式ドキュメンタリーで分かったAIの貢献（CloseBox）

画像内キャラを3D変換する強力モデル「Zero123++」、文章から高品質3Dモデル生成するAI「DreamCraft3D」など重要論文5本を解説（生成AIウィークリー）

生成AIグラビアをグラビアカメラマンが作るとどうなる？第11回：Stable Diffusion 1.5の注目ModelやLoRAを紹介+α版 (西川和久)

ベートーヴェンやクレオパトラなど、偉人になりきるAI「Character-LLM」、“グリグリ動かせる3Dシーン”をリアルタイム生成する「4D Gaussian Splatting」など重要論文5本を解説（生成AIウィークリー）

Python互換言語「Mojo」、Appleシリコンにネイティブ対応したMac版が公開。Pythonの9万倍、C言語に比肩する高速性

生成AIグラビアをグラビアカメラマンが作るとどうなる？第十回：実在モデルからSDXL用顔LoRAを作る (西川和久)

Pythonの高速スーパーセット「Mojo」がAppleシリコン搭載Macに対応間近。Windowsより先に

アップルがマルチモーダル大規模言語モデル「Ferret」を公開。画像内の形や場所を言葉で説明（生成AIウィークリー）

Google検索で直接AIによる画像生成が可能に。米国のSGE登録ユーザー対象

生成AI時代の新技術てんこ盛り。Adobe MAX 2023「Sneaks」を深掘りする（西田宗千佳）

生成AIグラビアをグラビアカメラマンが作るとどうなる？第九回：Fooocus-MREでimage-2-imageやControlNetを試す (西川和久)

どんなに長い文章でも破綻しない生成AI「StreamingLLM」、キャラクターの性格や話し方を模倣するAIなど重要論文5本を解説（生成AIウィークリー）

Google、スマホ用マルチモーダル生成AI「アシスタント with Bard」発表。AndroidとiOS に試験提供

ロビン・ウィリアムズの娘ゼルダ、AI生成で再現された父の姿や声が「個人的に不快」と非難

10倍高速に3Dモデル生成可能な「DreamGaussian」、ネット記事量産できる生成AI「InternLM-XComposer」など重要論文5本を解説（生成AIウィークリー）

生成AIグラビアをグラビアカメラマンが作るとどうなる？第八回：シンプルで高機能なSDXL専用インターフェースFooocusとFooocus-MREの使いかた (西川和久)

Metaが28人の生成AIキャラクターを発表した理由。どこまでもFacebook的なAI戦略（本田雅一）

等身大3Dデジタルヒューマンを動かしてみたらインパクトでかかった（CloseBox）

ハリウッドの脚本家組合、ストライキ終結に向け暫定合意。生成AIやストリーミングの収益分配を巡る交渉が決着へ

ChatGPT、画像と音声使った会話が可能に。Plusユーザーはモバイルアプリでマルチモーダルに

実在の人物の3Dバーチャルヒューマン化、生成AIとの組み合わせでうまくいきそう（CloseBox）

生成AIグラビアをグラビアカメラマンが作るとどうなる？第七回：自分で始める環境作りとお薦め機材 / AUTOMATIC1111を動かしてみる (西川和久)

数行のコード追加でStable Diffusion生成画像を高品質にする「FreeU」、Llama2を10万トークンに低コストで増やす手法「LongLoRA」など重要論文5本を解説（生成AIウィークリー）

Windows 11の「ペイント」大進化。26日に画像生成AIや背景除去、レイヤー機能を含むアップデート配信

AI画像生成ツール「DALL・E 3」発表。ChatGPTとの統合で対話的に生成し、プロンプトの理解度向上も

“好きな人の声”のオーディオブックを電子書籍から作るAI、AI画像を超高速生成する「InstaFlow」など重要論文5本を解説（生成AIウィークリー）

AIプログラマーは24時間耐久プログラミングが好きなの？　GPT4新機能にときめいたあなたは参加したいかも（CloseBox）