Generative AI

テクノロジー 2024 Feb 5

スマホ高品質画像生成、わずか0.2秒で。Google「MobileDiffusion」がiPhone 15 Proで達成。重要論文5本を解説（生成AIウィークリー）

iPhone 15 Proで0.2秒以内に高品質な512×512画像を生成することにGoogleが成功。生成AIに関する最新論文5本を解説します。

山下（Seamless）

テクノロジー 2024 Feb 5

生成AIおじさんをおじさん好きが作るとどうなる？（第1回）　ありふれたモチーフ「おじさん」を生成するための手法

生成AIによりおじさんの画像を作り出すためのツールや生成のコツのようなものをご紹介します。

kogu

テクノロジー 2024 Feb 3

Googleの会話AI『Bard』、賢いGemini Proが日本語でも利用可能に。回答のダブルチェックも対応

GoogleのチャットAIサービスBardで、日本語でもGemini Proを利用可能になりました。

山本竜也

テクノロジー 2024 Jan 31

生成AIグラビアをグラビアカメラマンが作るとどうなる？第17回：新技術をすぐ試せるComfyUIのインストール・使いかた (西川和久)

Stable Diffusionで生成AI画像を作る時、もっとも一般的なインターフェースはAUTOMATIC1111だろう。デファクトスタンダードと言ってもいいほどで、検索すると、インストール方法や使い方など、それこそ山盛り出てくる。ところが最近、ComfyUIがちょっとした人気だ。

西川和久

テクノロジー 2024 Jan 29

アーティストのAIへの反発をどう考える？　台北当代芸術館のAIアート展覧会「Hello Human!」で、キュレーターにAIアートの課題を聞きました（CloseBox）

台湾の台北当代芸術館（MoCA TAIPEI）で開催されているAIアート展覧会「你好，人類！Hello, Human!」にアーティストとして参加。この展示会のキュレータにAIとアートの関係について聞いてきました。

松尾公也

テクノロジー 2024 Jan 29

Amazonが服の仮想試着AI「Diffuse to Choose」、画像内の物体分離指示できる「Grounded SAM」、動画の高品質な奥行き推定「Depth Anything」など重要論文6本を解説（生成AIウィークリー）

今回の生成AI論文解説はいつもより1本多い、6本分です。中でもAmazonのバーチャル試着技術は実用性が高そうです。

山下（Seamless）

テクノロジー 2024 Jan 27

伝説のコメディアンをAIで「復活」させたYouTube番組を遺族が提訴「不謹慎な人間が作った粗悪な模造品」

米国の伝説的スタンダップコメディアン、ジョージ・カーリンの声をAIで模倣して製作された1時間のYouTube番組に対し、カーリンの娘は「偉大な米国人アーティストの業績」を盗んだとして、遺産管理団体を通じて著作権侵害とパブリシティ権侵害の訴訟を起こしました。

Munenori Taniguchi

テクノロジー 2024 Jan 22

GPT-4のコード生成精度を2倍以上向上させる「AlphaCodium」、写真1枚から本人性を維持した画像を量産できる「InstantID」など重要論文5本を解説（生成AIウィークリー）

PhotoMakerのライバルともいうべき技術やAppleのLLMなど、生成AI最新論文の概要5つを紹介します。

山下（Seamless）

テクノロジー 2024 Jan 21

生成AIグラビアをグラビアカメラマンが作るとどうなる？第16回：指問題解決！？Hand Refiner (西川和久)

Hand Refinerは2023年12月1日に論文、その後、2024年1月初旬にAUTOMATIC1111のADetailerとComfyUIで使用可能になった手(指)に関する新手法だ。今回ご紹介するHand Refinerはかなりロジカル。具体的には、画像から手を認識、認識した位置での形や5本指などリファレンスになる手を深度情報で取得、その深度情報を使って手をInpaintする、ざっくりこの3段構えとなる。

西川和久

テクノロジー 2024 Jan 19

Steamが生成AI使用ゲーム全面禁止から原則受け入れに転換。理由と影響をゲーム開発者目線で考える

PC向けゲーム配信プラットフォーム最大手のSteamがAIコンテンツについての新たな方針を発表しました。生成AIを用いて作られた大半のゲームを受け入れるという大きな変更です。

kogu

テクノロジー 2024 Jan 17

最低1枚の元写真があれば、高品質本人画像をすぐに生成できる「PhotoMaker」を試したらお手軽すぎた（CloseBox）

最低1枚の写真があれば、その人物の画像をいくらでも生成できる。そんな技術が登場したので使ってみた。

松尾公也

テクノロジー 2024 Jan 16

マイクロソフト、個人向け生成AIサブスク「Copilot Pro」提供開始。Officeアプリでも利用可能、月額3200円

Microsoftは1月15日（現地時間）、生成AIサービス「Copilot」の個人向けサブスクリプションサービス「Copilot Pro」を発表、提供を開始しました。

山本竜也

テクノロジー 2024 Jan 15

Animate Anyoneのオープンソース再現実装版が登場、GPT-4の次に性能が高い商用利用可能な新AIモデル「Mixtral 8x7B」など重要論文を解説（生成AIウィークリー）

今回は生成AI論文解説に加え、2つの興味深い実装も紹介しています。

山下（Seamless）

テクノロジー 2024 Jan 11

矢印を書き込んで動きを制御できる動画生成AI「DragNUWA」使いかたと注意点

生成AIにより静止画に動きを与える技術がいくつか出てきましたが、求める動きを出すのはなかなか難しいものがあります。今回紹介する「DragNUWA」は、そんな弱点を補ってくれるユーザーインタフェースを備えています。

kogu

テクノロジー 2024 Jan 9

「你好，人類！Hello, Human!」という台湾のAIアート展覧会に参加します（CloseBox）

台湾の現代アート美術館で、筆者のAI作品が展示されることになりました。

松尾公也

テクノロジー 2024 Jan 8

他言語で感情表現も可能な音声クローンAI「OpenVoice」、対談音声から動き付きリアルアバター生成するAIモデルなど重要論文5本を解説（生成AIウィークリー）

感情を含む細かい表現が可能なAIボイスクローン技術「OpenVoice」など、生成AI最新論文の概要5つをお届けします。

山下（Seamless）

テクノロジー 2024 Jan 1

GPT-4の回答を向上させる「プロンプト26の原則」、220以上の生成タスクが実行可能なマルチモーダルモデル「Unified-IO 2」など重要論文5本を解説（生成AIウィークリー）

「礼儀は不要」「モデルに質問させる」「良い解答には報酬」など、大規模言語モデルの返答が向上する「プロンプト26の原則」をはじめとする5つの生成AI論文を紹介します。

山下（Seamless）

テクノロジー 2023 Dec 31

元トランプ大統領の個人弁護士、Google Bard生成のニセ判例を提出して追求受ける「本物のような文章を生成するサービスとは知らなかった」

トランプ政権において、大統領の個人弁護士兼フィクサーとして活動したマイケル・コーエン氏が、12月はじめに裁判所に提出した公式書類に存在しない判例を記していたことを裁判所から追求され、それがAIで生成したものであることを認めました。

Munenori Taniguchi

ガジェット 2023 Dec 31

マイクロソフト、iPhone / iPad版Copilotアプリ配信開始。無料でGPT-4も利用可能、画像生成や図で説明も

マイクロソフトはApp StoreでiOS/iPadOS用の「Microsoft Copilot」アプリを配信開始しました。少し前に、Android版アプリも公開されています。

Kiyoshi Tane

テクノロジー 2023 Dec 29

画像・音声・文書・作曲、すべてが生成AIに頼れるようになった2023年を自分の記事で振り返る（CloseBox）

2023年（のちょっと前から）の生成AIの動きというか広がり、勢いを、自分の取り組みを中心にまとめてみました。

松尾公也

テクノロジー 2023 Dec 29

New York Times、著作権侵害でマイクロソフトとOpenAIを提訴。フェアユースにあたらずと主張

米国第3位の発行部数を誇る新聞社New York Timesが、マイクロソフトとOpenAIに対し著作権侵害の訴訟を起こしました。

Munenori Taniguchi

テクノロジー 2023 Dec 27

マイクロソフト、CopilotアプリをGoogle Playストアで配信開始

Microsoftが、Android向けのGoogle Playストアにて「Microsoft Copilot」アプリの配信を開始しました。

山本竜也

テクノロジー 2023 Dec 25

毎秒100枚の画像を高速生成できる「StreamDiffusion」、文章指示で複数の動く3Dキャラを生成するNVIDIA開発「AYG」など重要論文5本を解説（生成AIウィークリー）

生成AIの重要論文5本解説する連載。今回は、毎秒100枚という画像高速生成できると話題を呼んだ「StreamDiffusion」、文章指示で複数の動く3Dキャラを生成するNVIDIAの4Dアニメーションツール「AYG」などを紹介しています。

山下（Seamless）

テクノロジー 2023 Dec 24

AIが商用サイトを作ってくれるサービスSolo、Mozillaがベータ開始。SNSやリンクから文章作成、フリー画像挿入に公開まで。実際に試した結果

Mozillaは、基本的な情報を入力するとAIが自動的にWebサイトのデザインを作成し、Webサイトの公開まで可能なサービス「Solo」を公開しました。

新野淳一

テクノロジー 2023 Dec 21

Microsoft Copilot（とSuno AIプラグイン）だけで無料曲作り。チャットだけで超簡単に作曲するやりかた教えます（CloseBox）

Suno AIよりさらに簡単に完成曲を作れるようになりました。Microsoft Copilotで作曲する方法とその制限事項などについて調べました。

松尾公也

テクノロジー 2023 Dec 20

作曲 AIの「Suno」がMicrosoft Copilotに統合。現在分かっていること（CloseBox）

マイクロソフトは12月20日、作詞・作曲・演奏・歌唱まで可能なAI作曲サービス「Suno」を自社のAIプラットフォームであるWindows Copilotに統合すると発表しました。

松尾公也

テクノロジー 2023 Dec 19

生成AIグラビアをグラビアカメラマンが作るとどうなる？第15回：SDXLでのControlNet活用方法その2＋衣服を固定できるOutfit Anyone (西川和久)

連載第13回目ではControlNetのCanny、Depth、OpenPoseをご紹介した。続きに入る前に軽くおさらいすると、ControlNetは指定した画像を使って、構図や絵柄、ポーズ、そして書かれている内容(Prompt相当)などを抽出し、生成する画像を固定する方法だ。

西川和久

テクノロジー 2023 Dec 18

AIで作曲して演奏・歌唱してくれる「Suno」、MIDIで吐いてくれPleaseとお嘆きの方に。無料のもあるよ（CloseBox）

歌詞を与えれば作曲・演奏・歌唱と残りの全てをやってくれるAI作曲完パケサービス「Suno」ですが、音楽制作界隈では「MIDIで吐いてくれ」との声が多く上がっています。

松尾公也

テクノロジー 2023 Dec 18

「Suno」と一味違う音楽生成AI登場。音楽から新しい音楽をパート毎に生成「StemGen」、着せ替えAI「Outfit Anyone」など重要論文5本を解説（生成AIウィークリー）

音楽生成に新たな展開が。Music to Musicによる生成をパートごとに出せる技術が登場しています。生成AIに関する論文5つを紹介します。

山下（Seamless）

テクノロジー 2023 Dec 15

作曲歌唱AI「Suno」、今からでも間に合う制作マニュアル。やり方がちょっと変わったので（CloseBox）

AI作曲サービスSunoのUIがガラリと変わったので、使い方をまとめてみました。

松尾公也

テクノロジー 2023 Dec 14

AI作曲でマルチモーダル活用。Suno + ChatGPT + Stable Diffusionを連携させたらエモくなった（CloseBox）

Suno短期連載第3弾。Suno + ChatGPT + Stable Diffusionを連携させてAI楽曲を作る試みです。

松尾公也

テクノロジー 2023 Dec 14

生成AIグラビアをグラビアカメラマンが作るとどうなる？第14回：2023年下半期まとめ+α　13回分を振り返る (西川和久)

生成AIは技術の進歩/進化が凄まじいペースで数ヶ月前はもうかなり古い話になることもあり、今回はこれまでの13回分をまとめてみたい。　

西川和久

テクノロジー 2023 Dec 13

生成AI「Suno」が作った楽曲は再利用できる？　分解して想像した、「Suno以降」の音楽制作と音楽体験（CloseBox）

Sunoで作った楽曲を音源分離し、再構築して歌ってみました。そこで、Suno以降の音楽制作と音楽体験のあり方について考えてみました。

松尾公也

テクノロジー 2023 Dec 11

「人のぬくもり、理解できない」AI「Suno」が作詞・作曲・演奏し、歌う美しいバラードに感動した（CloseBox）

感動できるボーカル曲をAIがほぼ一発で生成できるようになりました。

松尾公也

テクノロジー 2023 Dec 11

写真内の奥行きを推定する「Marigold」、言語に頼らず画像理解する「Large Vision Model」、数分間の高品質ビデオ作成する「Vchitect」など重要論文6本を解説（生成AIウィークリー）

今週は重要論文が多くて6本です。画像の深度情報を推定する技術を大幅に進化させた「Marigold」などの生成AIの最新情報をお届けします。

山下（Seamless）

テクノロジー 2023 Dec 11

Googleの新AIモデル「Gemini」。Ultraすごいマルチモーダルデモの種明かし（Google Tales）

動画がすごすぎると話題を呼んだGoogle Gemini Ultraですが……。

佐藤由紀子

テクノロジー 2023 Dec 7

Google、新AIモデル「Gemini」発表。動画もネイティブに理解するマルチモーダル、Pixel 8 Proにも導入へ

日本時間12月7日、Googleは新開発のAIモデル「Gemini」を発表しました。モバイル機器からデータセンターまで、あらゆる用途に対応すべく、Gemini Ultra、Gemini Pro、Gemini Nanoの3種類を用意しています。

Munenori Taniguchi

テクノロジー 2023 Dec 6

AIで「普通のおじさん」を生成したフェイク新聞の作り方。そこから考える「普通」への疑い

生成AIの出力画像を元にCGで作った新聞っぽいフェイク画像をXに投稿したところ、想像以上の反響がありました。気軽な実験のつもりで説明も雑過ぎたため、伝わりにくかったり誤解されたりした部分もあるようです。どのように、なぜ作ったのか補足します。

kogu

テクノロジー 2023 Dec 6

現実の魔法具、iPhoneサイズの立体映像装置「Looking Glass Go」。2台も買って何をするのか（CloseBox）

手のひらに乗る立体視ディスプレイ「Looking Glass Go」を2台買ってしまいました。その理由は……。

松尾公也

テクノロジー 2023 Dec 4

画像内のキャラを思うがままに抜群の精度で動かせる「Animate Anyone」、話した声をすぐに翻訳するMeta「Seamless」など重要論文5本を解説（生成AIウィークリー）

先週大きな話題となった、画像内のキャラクターや写真内の人物を骨格動画に応じて動かせる「Animate Anyone」など5本の生成AI論文を紹介。

山下（Seamless）

テクノロジー 2023 Nov 30

ChatGPTに同じ言葉を連呼させると、壊れて学習データ(個人情報入り)を吐き出す？Google DeepMind研究者らのチームが論文発表

Google DeepMindや複数の大学の研究者からなるチームが、AI企業に対し、単純な攻撃がプライバシー関連の問題を起こす可能性があるとして、大規模言語モデル（LLM）をリリースする前に内部や第三者による安全性テストを実施するよう求めています。

Munenori Taniguchi

テクノロジー 2023 Nov 27

Humaneのバッジ型AIウェアラブル「Ai Pin」を注文してわかったこと。米国外で使える？　アクセサリは？

元アップル社員が開発し、OpenAIのサム・アルトマンも出資したと話題になっていたAIウェアラブルがついに発売（米国のみ）。これを購入できた五島正浩さんに、購入時の様子をレポートしてもらいました。

五島正浩

スマホ高品質画像生成、わずか0.2秒で。Google「MobileDiffusion」がiPhone 15 Proで達成。重要論文5本を解説（生成AIウィークリー）

生成AIおじさんをおじさん好きが作るとどうなる？（第1回） ありふれたモチーフ「おじさん」を生成するための手法

Googleの会話AI『Bard』、賢いGemini Proが日本語でも利用可能に。回答のダブルチェックも対応

生成AIグラビアをグラビアカメラマンが作るとどうなる？第17回：新技術をすぐ試せるComfyUIのインストール・使いかた (西川和久)

アーティストのAIへの反発をどう考える？ 台北当代芸術館のAIアート展覧会「Hello Human!」で、キュレーターにAIアートの課題を聞きました（CloseBox）

Amazonが服の仮想試着AI「Diffuse to Choose」、画像内の物体分離指示できる「Grounded SAM」、動画の高品質な奥行き推定「Depth Anything」など重要論文6本を解説（生成AIウィークリー）

伝説のコメディアンをAIで「復活」させたYouTube番組を遺族が提訴「不謹慎な人間が作った粗悪な模造品」

GPT-4のコード生成精度を2倍以上向上させる「AlphaCodium」、写真1枚から本人性を維持した画像を量産できる「InstantID」など重要論文5本を解説（生成AIウィークリー）

生成AIグラビアをグラビアカメラマンが作るとどうなる？第16回：指問題解決！？Hand Refiner (西川和久)

Steamが生成AI使用ゲーム全面禁止から原則受け入れに転換。理由と影響をゲーム開発者目線で考える

最低1枚の元写真があれば、高品質本人画像をすぐに生成できる「PhotoMaker」を試したらお手軽すぎた（CloseBox）

マイクロソフト、個人向け生成AIサブスク「Copilot Pro」提供開始。Officeアプリでも利用可能、月額3200円

Animate Anyoneのオープンソース再現実装版が登場、GPT-4の次に性能が高い商用利用可能な新AIモデル「Mixtral 8x7B」など重要論文を解説（生成AIウィークリー）

矢印を書き込んで動きを制御できる動画生成AI「DragNUWA」使いかたと注意点

「你好，人類！Hello, Human!」という台湾のAIアート展覧会に参加します（CloseBox）

他言語で感情表現も可能な音声クローンAI「OpenVoice」、対談音声から動き付きリアルアバター生成するAIモデルなど重要論文5本を解説（生成AIウィークリー）

GPT-4の回答を向上させる「プロンプト26の原則」、220以上の生成タスクが実行可能なマルチモーダルモデル「Unified-IO 2」など重要論文5本を解説（生成AIウィークリー）

元トランプ大統領の個人弁護士、Google Bard生成のニセ判例を提出して追求受ける「本物のような文章を生成するサービスとは知らなかった」

マイクロソフト、iPhone / iPad版Copilotアプリ配信開始。無料でGPT-4も利用可能、画像生成や図で説明も

画像・音声・文書・作曲、すべてが生成AIに頼れるようになった2023年を自分の記事で振り返る（CloseBox）

New York Times、著作権侵害でマイクロソフトとOpenAIを提訴。フェアユースにあたらずと主張

マイクロソフト、CopilotアプリをGoogle Playストアで配信開始

毎秒100枚の画像を高速生成できる「StreamDiffusion」、文章指示で複数の動く3Dキャラを生成するNVIDIA開発「AYG」など重要論文5本を解説（生成AIウィークリー）

AIが商用サイトを作ってくれるサービスSolo、Mozillaがベータ開始。SNSやリンクから文章作成、フリー画像挿入に公開まで。実際に試した結果

Microsoft Copilot（とSuno AIプラグイン）だけで無料曲作り。チャットだけで超簡単に作曲するやりかた教えます（CloseBox）

作曲 AIの「Suno」がMicrosoft Copilotに統合。現在分かっていること（CloseBox）

生成AIグラビアをグラビアカメラマンが作るとどうなる？第15回：SDXLでのControlNet活用方法その2＋ 衣服を固定できるOutfit Anyone (西川和久)

AIで作曲して演奏・歌唱してくれる「Suno」、MIDIで吐いてくれPleaseとお嘆きの方に。無料のもあるよ（CloseBox）

「Suno」と一味違う音楽生成AI登場。音楽から新しい音楽をパート毎に生成「StemGen」、着せ替えAI「Outfit Anyone」など重要論文5本を解説（生成AIウィークリー）

作曲歌唱AI「Suno」、今からでも間に合う制作マニュアル。やり方がちょっと変わったので（CloseBox）

AI作曲でマルチモーダル活用。Suno + ChatGPT + Stable Diffusionを連携させたらエモくなった（CloseBox）

生成AIグラビアをグラビアカメラマンが作るとどうなる？第14回：2023年下半期まとめ+α 13回分を振り返る (西川和久)

生成AI「Suno」が作った楽曲は再利用できる？ 分解して想像した、「Suno以降」の音楽制作と音楽体験（CloseBox）

「人のぬくもり、理解できない」AI「Suno」が作詞・作曲・演奏し、歌う美しいバラードに感動した（CloseBox）

写真内の奥行きを推定する「Marigold」、言語に頼らず画像理解する「Large Vision Model」、数分間の高品質ビデオ作成する「Vchitect」など重要論文6本を解説（生成AIウィークリー）

Googleの新AIモデル「Gemini」。Ultraすごいマルチモーダルデモの種明かし（Google Tales）

Google、新AIモデル「Gemini」発表。動画もネイティブに理解するマルチモーダル、Pixel 8 Proにも導入へ

AIで「普通のおじさん」を生成したフェイク新聞の作り方。そこから考える「普通」への疑い

現実の魔法具、iPhoneサイズの立体映像装置「Looking Glass Go」。2台も買って何をするのか（CloseBox）

画像内のキャラを思うがままに抜群の精度で動かせる「Animate Anyone」、話した声をすぐに翻訳するMeta「Seamless」など重要論文5本を解説（生成AIウィークリー）

ChatGPTに同じ言葉を連呼させると、壊れて学習データ(個人情報入り)を吐き出す？Google DeepMind研究者らのチームが論文発表

Humaneのバッジ型AIウェアラブル「Ai Pin」を注文してわかったこと。米国外で使える？ アクセサリは？

生成AIおじさんをおじさん好きが作るとどうなる？（第1回）　ありふれたモチーフ「おじさん」を生成するための手法

アーティストのAIへの反発をどう考える？　台北当代芸術館のAIアート展覧会「Hello Human!」で、キュレーターにAIアートの課題を聞きました（CloseBox）

生成AIグラビアをグラビアカメラマンが作るとどうなる？第15回：SDXLでのControlNet活用方法その2＋衣服を固定できるOutfit Anyone (西川和久)

生成AIグラビアをグラビアカメラマンが作るとどうなる？第14回：2023年下半期まとめ+α　13回分を振り返る (西川和久)

生成AI「Suno」が作った楽曲は再利用できる？　分解して想像した、「Suno以降」の音楽制作と音楽体験（CloseBox）

Humaneのバッジ型AIウェアラブル「Ai Pin」を注文してわかったこと。米国外で使える？　アクセサリは？