
OpenAI、文章から驚異的品質の動画を生成するモデル「Sora」発表。試せる一般公開はまだ先、世界を描ける汎用の生成AIレンダラになり得るか
OpenAIから新しい動画生成モデル「Sora」が発表され、合わせて技術レポートも公開されました。Soraはテキストから最長1分の動画を生成できるモデルで、画像から動画の生成や動画の補完も可能。作例を見る限り、現在公開されているどの動画生成モデルよりも優れています。

Slack AI提供開始、長いスレッド要約や会話で検索など。まずはEnterpriseプラン有料アドオンから、日本では4月予定
Slackは2月14日(現地時間)、2023年に予告していた生成AI機能「Slack AI」の一般提供を米国と英国にて開始したと発表しました。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第18回:バレンタイン編。ComfyUIの環境を整える (西川和久)
グラビアカメラマンでありソフトウェアエンジニアでもある西川和久氏による生成AI
グラビア実践講座 第18回をお届けします

複数の同一人物を同時に量産できるNVIDIAの画像生成AI「ConsiStory」、Gemini UltraやGPT-4に匹敵する数学特化のオープンソース言語モデル「DeepSeekMath」など重要論文5本を解説(生成AIウィークリー)
複数の同一人物を同時に量産できるNVIDIAの画像生成AI「ConsiStory」、Gemini UltraやGPT-4に匹敵する数学特化のオープンソース言語モデル「DeepSeekMath」などを解説します。

生成AIで大統領候補のフェイク画像作成、Midjourneyが禁止検討。トランプおよびバイデン両氏を含む
Midjourneyは今後1年間、同社の人工知能ソフトウェアを使って政治的な画像を作成すること、特にジョー・バイデン氏とドナルド・トランプ氏の画像生成を禁止することを検討しています。

Google One加入者数が1億人を突破、ピチャイCEOが発表。Gemini AI機能追加で加入者増を狙う
米Googleのスンダー・ピチャイCEOは、同社の有料クラウドストレージサービス「Google One」の加入者が1億人を突破したことを発表しました。

Google最高峰AIモデル「Gemini Ultra」解禁。月額2900円のGoogle One新プラン「AIプレミアム」で提供開始
Googleは新開発したAIモデルの最高峰「Gemini Ultra」の提供を開始しました。また、対話型AIサービスの名前を「Bard」から「Gemini」に変更します。

アップル、文章で画像を編集するAIモデル「MGIE」開発。GitHubにオープンソース公開
アップルの研究者らが、入力した文章によって画像を編集できるAIモデル「MGIE」を発表、公開しました。MGIEとはMLLM-Guided Image Editingの略で、テキストベースのコマンドを解釈するマルチモーダル大規模言語モデル(MLLM)を使用しています。

米Amazonがショッピング向けAIアシスタント「Rufus」発表。製品カタログやレビューなどをもとに買い物をサポート
米Amazonは2月2日(現地時間)、ショッピング向けのAIアシスタント「Rufus」を発表しました。米国でAmazonのモバイルアプリを利用する一部ユーザーに対してベータ版が提供開始されており、今後数週間のうちに米国のさらに多くのユーザーに展開されるとのことです。

スマホ高品質画像生成、わずか0.2秒で。Google「MobileDiffusion」がiPhone 15 Proで達成。重要論文5本を解説(生成AIウィークリー)
iPhone 15 Proで0.2秒以内に高品質な512×512画像を生成することにGoogleが成功。生成AIに関する最新論文5本を解説します。

生成AIおじさんをおじさん好きが作るとどうなる?(第1回) ありふれたモチーフ「おじさん」を生成するための手法
生成AIによりおじさんの画像を作り出すためのツールや生成のコツのようなものをご紹介します。

Googleの会話AI『Bard』、賢いGemini Proが日本語でも利用可能に。回答のダブルチェックも対応
GoogleのチャットAIサービスBardで、日本語でもGemini Proを利用可能になりました。

「アップルAI」は今年発表へ、クックCEOが明言。WWDCでLLM版 Siri搭載のiOS 18発表?
アップルが未発表製品に関して言及することは、厳しい秘密主義のためか滅多にありません。

サムスン、生成AI機能Galaxy AI はS23やZ Fold5 / Flip5 など既存モデルにも提供。有料化は未定
サムスンの最新フラッグシップ・スマートフォンGalaxy S24シリーズでは、生成AIの「Galaxy AI」が大きなセールスポイントとなっています。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第17回:新技術をすぐ試せるComfyUIのインストール・使いかた (西川和久)
Stable Diffusionで生成AI画像を作る時、もっとも一般的なインターフェースはAUTOMATIC1111だろう。デファクトスタンダードと言ってもいいほどで、検索すると、インストール方法や使い方など、それこそ山盛り出てくる。ところが最近、ComfyUIがちょっとした人気だ。

薄型ノートLG gram 2024年モデル国内発表。144Hz VRR対応のgram Pro追加、全機種インテルCore Ultra搭載のAI PC
LGが薄型ノート LG gram シリーズの2024年モデルを国内発表しました。

日本HP、Core Ultra搭載の2 in 1「Spectre x360」&ゲーミングノート「OMEN」発表。AI PCに先駆けるAIテクノロジー内蔵PC
2024年1月18日、日本HPが2024年度の事業説明会を開始し、同時にCore Ultra搭載のプレミアム2in1「HP Spectre x360 14」、「HP Spectre x360 16」およびゲーミングノートPC「HP Omen Transcend 14」の国内向けの発表を行いました。

中国向けGalaxy S24シリーズ、AI機能はGoogleではなく百度の「Ernie 4.0」に。製品ページにもGoogleへの言及なし
サムスンの最新フラッグシップスマートフォン Galaxy S24シリーズは、「Galaxy AI」搭載が特徴のひとつです。それら機能の多くは、Googleの大規模言語モデルGemini Proと画像生成モデル Imagen 2をクラウド経由で活用するもの。しかし、サムスンは中国向けGalaxy S24シリーズにはGeminiではなく、現地企業の百度(Baidu)が開発したAIチャットボット「Ernie 4.0」を採用したことを発表しました。

アーティストのAIへの反発をどう考える? 台北当代芸術館のAIアート展覧会「Hello Human!」で、キュレーターにAIアートの課題を聞きました(CloseBox)
台湾の台北当代芸術館(MoCA TAIPEI)で開催されているAIアート展覧会「你好,人類!Hello, Human!」にアーティストとして参加。この展示会のキュレータにAIとアートの関係について聞いてきました。

Amazonが服の仮想試着AI「Diffuse to Choose」、画像内の物体分離指示できる「Grounded SAM」、動画の高品質な奥行き推定「Depth Anything」など重要論文6本を解説(生成AIウィークリー)
今回の生成AI論文解説はいつもより1本多い、6本分です。中でもAmazonのバーチャル試着技術は実用性が高そうです。

Windows 11がAIノイキャンに標準対応、スマホ写真を即転送など新機能予告。Insider Preview Canary Channelで
マイクロソフトがWindows 11の先行テスト版 Insider Preview Build 20640 (Canary Channel) の新機能を予告しました。

Google、Chromeのタブ増えすぎ問題をAIで解決。スマートタブ整理やどこでも文例生成など3つの実験AI機能を導入
米Googleはデスクトップ用Chromeブラウザの最新版「M121」をリリースし、実験的な生成AI機能を3つ導入すると発表しました。

GPT-4のコード生成精度を2倍以上向上させる「AlphaCodium」、写真1枚から本人性を維持した画像を量産できる「InstantID」など重要論文5本を解説(生成AIウィークリー)
PhotoMakerのライバルともいうべき技術やAppleのLLMなど、生成AI最新論文の概要5つを紹介します。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第16回:指問題解決!?Hand Refiner (西川和久)
Hand Refinerは2023年12月1日に論文、その後、2024年1月初旬にAUTOMATIC1111のADetailerとComfyUIで使用可能になった手(指)に関する新手法だ。今回ご紹介するHand Refinerはかなりロジカル。具体的には、画像から手を認識、認識した位置での形や5本指などリファレンスになる手を深度情報で取得、その深度情報を使って手をInpaintする、ざっくりこの3段構えとなる。

Steamが生成AI使用ゲーム全面禁止から原則受け入れに転換。理由と影響をゲーム開発者目線で考える
PC向けゲーム配信プラットフォーム最大手のSteamがAIコンテンツについての新たな方針を発表しました。生成AIを用いて作られた大半のゲームを受け入れるという大きな変更です。

Galaxy S24シリーズ実機ハンズオン。AI全面採用で翻訳や文字起こし、画像編集機能が強化。ニアバイシェアはクイック共有に(石野純也)
サムスン電子は、1月17日(現地時間)に米カリフォルニア州サンノゼで、製品紹介イベントの「Galaxy Unpacked」を開催。24年のフラッグシップモデルとなる「Galaxy S24」「Galaxy S24+」「Galaxy S24 Ultra」の3機種を発表しました。短時間ではありますが、この3モデルに触れることができたので、ここではそのレポートをお届けします。

最低1枚の元写真があれば、高品質本人画像をすぐに生成できる「PhotoMaker」を試したらお手軽すぎた(CloseBox)
最低1枚の写真があれば、その人物の画像をいくらでも生成できる。そんな技術が登場したので使ってみた。

マイクロソフト、個人向け生成AIサブスク「Copilot Pro」提供開始。Officeアプリでも利用可能、月額3200円
Microsoftは1月15日(現地時間)、生成AIサービス「Copilot」の個人向けサブスクリプションサービス「Copilot Pro」を発表、提供を開始しました。

Animate Anyoneのオープンソース再現実装版が登場、GPT-4の次に性能が高い商用利用可能な新AIモデル「Mixtral 8x7B」など重要論文を解説(生成AIウィークリー)
今回は生成AI論文解説に加え、2つの興味深い実装も紹介しています。

『プリンス・オブ・ペルシャ』新作、うっかり一部NPCの音声収録を忘れる。読上げソフトの仮音声のまま発売へ
Ubisoftが1月15日(日本は18日)に発売する、新作ゲーム『プリンス・オブ・ペルシャ 失われた王冠』のなかで、一部NPC(Nom Player Character)のセリフが、テキスト読み上げソフトによる仮の音声のままリリース版に含まれてしまっていることがわかりました。

OpenAIがGPT Store開設、早速「SEOブログ記事自動生成」「AI検出回避に人間らしく加工」等が人気。レベニューシェア収益化も
OpenAIが、かねてから予告していたGPT Store をようやく開設しました。

矢印を書き込んで動きを制御できる動画生成AI「DragNUWA」使いかたと注意点
生成AIにより静止画に動きを与える技術がいくつか出てきましたが、求める動きを出すのはなかなか難しいものがあります。今回紹介する「DragNUWA」は、そんな弱点を補ってくれるユーザーインタフェースを備えています。

モバイルAI端末rabbit r1発表。ウサギAIがアプリを代わりに操作してくれるコンシェルジュ的デバイス
AIハードウェアスタートアップのrabbitが、モバイルAI端末rabbit r1を発表しました。
様々なアプリやサービスを学習したAIが、ユーザーの指示に応えてかわりに操作して用事を済ませてくれる、執事かコンシェルジュのような発想の製品です。

「你好,人類!Hello, Human!」という台湾のAIアート展覧会に参加します(CloseBox)
台湾の現代アート美術館で、筆者のAI作品が展示されることになりました。

他言語で感情表現も可能な音声クローンAI「OpenVoice」、対談音声から動き付きリアルアバター生成するAIモデルなど重要論文5本を解説(生成AIウィークリー)
感情を含む細かい表現が可能なAIボイスクローン技術「OpenVoice」など、生成AI最新論文の概要5つをお届けします。

GPT-4の回答を向上させる「プロンプト26の原則」、220以上の生成タスクが実行可能なマルチモーダルモデル「Unified-IO 2」など重要論文5本を解説(生成AIウィークリー)
「礼儀は不要」「モデルに質問させる」「良い解答には報酬」など、大規模言語モデルの返答が向上する「プロンプト26の原則」をはじめとする5つの生成AI論文を紹介します。

元トランプ大統領の個人弁護士、Google Bard生成のニセ判例を提出して追求受ける「本物のような文章を生成するサービスとは知らなかった」
トランプ政権において、大統領の個人弁護士兼フィクサーとして活動したマイケル・コーエン氏が、12月はじめに裁判所に提出した公式書類に存在しない判例を記していたことを裁判所から追求され、それがAIで生成したものであることを認めました。

マイクロソフト、iPhone / iPad版Copilotアプリ配信開始。無料でGPT-4も利用可能、画像生成や図で説明も
マイクロソフトはApp StoreでiOS/iPadOS用の「Microsoft Copilot」アプリを配信開始しました。少し前に、Android版アプリも公開されています。

画像・音声・文書・作曲、すべてが生成AIに頼れるようになった2023年を自分の記事で振り返る(CloseBox)
2023年(のちょっと前から)の生成AIの動きというか広がり、勢いを、自分の取り組みを中心にまとめてみました。

マイクロソフト、CopilotアプリをGoogle Playストアで配信開始
Microsoftが、Android向けのGoogle Playストアにて「Microsoft Copilot」アプリの配信を開始しました。

毎秒100枚の画像を高速生成できる「StreamDiffusion」、文章指示で複数の動く3Dキャラを生成するNVIDIA開発「AYG」など重要論文5本を解説(生成AIウィークリー)
生成AIの重要論文5本解説する連載。今回は、毎秒100枚という画像高速生成できると話題を呼んだ「StreamDiffusion」、文章指示で複数の動く3Dキャラを生成するNVIDIAの4Dアニメーションツール「AYG」などを紹介しています。

AIが商用サイトを作ってくれるサービスSolo、Mozillaがベータ開始。SNSやリンクから文章作成、フリー画像挿入に公開まで。実際に試した結果
Mozillaは、基本的な情報を入力するとAIが自動的にWebサイトのデザインを作成し、Webサイトの公開まで可能なサービス「Solo」を公開しました。