AI

作曲歌唱AI「Suno」、今からでも間に合う制作マニュアル。やり方がちょっと変わったので(CloseBox) 画像
AI

作曲歌唱AI「Suno」、今からでも間に合う制作マニュアル。やり方がちょっと変わったので(CloseBox)

AI作曲サービスSunoのUIがガラリと変わったので、使い方をまとめてみました。

AI作曲でマルチモーダル活用。Suno + ChatGPT + Stable Diffusionを連携させたらエモくなった(CloseBox) 画像
AI

AI作曲でマルチモーダル活用。Suno + ChatGPT + Stable Diffusionを連携させたらエモくなった(CloseBox)

Suno短期連載第3弾。Suno + ChatGPT + Stable Diffusionを連携させてAI楽曲を作る試みです。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第14回:2023年下半期まとめ+α 13回分を振り返る (西川和久) 画像
Science

生成AIグラビアをグラビアカメラマンが作るとどうなる?第14回:2023年下半期まとめ+α 13回分を振り返る (西川和久)

生成AIは技術の進歩/進化が凄まじいペースで数ヶ月前はもうかなり古い話になることもあり、今回はこれまでの13回分をまとめてみたい。 

テスラ、ヒト型ロボット「Optimus Gen 2」公開。手足の動作がよりなめらかに 画像
Other

テスラ、ヒト型ロボット「Optimus Gen 2」公開。手足の動作がよりなめらかに

テスラはX(Twitter)でヒト型ロボット「Optimus」の第2世代(Gen 2)となるバージョンを公開しました。紹介動画では、前世代バージョンよりも立居振舞が自然な雰囲気に近づいたように見えます。

生成AI「Suno」が作った楽曲は再利用できる? 分解して想像した、「Suno以降」の音楽制作と音楽体験(CloseBox) 画像
AI

生成AI「Suno」が作った楽曲は再利用できる? 分解して想像した、「Suno以降」の音楽制作と音楽体験(CloseBox)

Sunoで作った楽曲を音源分離し、再構築して歌ってみました。そこで、Suno以降の音楽制作と音楽体験のあり方について考えてみました。

Inter BEEはAIとプライバシーがいっぱい。次の技術トレンドは「繋がる」だ(小寺信良) 画像
AI

Inter BEEはAIとプライバシーがいっぱい。次の技術トレンドは「繋がる」だ(小寺信良)

Inter BEE 2023で取材した中から、未来のトレンドを読み取ってみた。

「人のぬくもり、理解できない」AI「Suno」が作詞・作曲・演奏し、歌う美しいバラードに感動した(CloseBox) 画像
AI

「人のぬくもり、理解できない」AI「Suno」が作詞・作曲・演奏し、歌う美しいバラードに感動した(CloseBox)

感動できるボーカル曲をAIがほぼ一発で生成できるようになりました。

写真内の奥行きを推定する「Marigold」、言語に頼らず画像理解する「Large Vision Model」、数分間の高品質ビデオ作成する「Vchitect」など重要論文6本を解説(生成AIウィークリー) 画像
AI

写真内の奥行きを推定する「Marigold」、言語に頼らず画像理解する「Large Vision Model」、数分間の高品質ビデオ作成する「Vchitect」など重要論文6本を解説(生成AIウィークリー)

今週は重要論文が多くて6本です。画像の深度情報を推定する技術を大幅に進化させた「Marigold」などの生成AIの最新情報をお届けします。

Googleの新AIモデル「Gemini」。Ultraすごいマルチモーダルデモの種明かし(Google Tales) 画像
AI

Googleの新AIモデル「Gemini」。Ultraすごいマルチモーダルデモの種明かし(Google Tales)

動画がすごすぎると話題を呼んだGoogle Gemini Ultraですが……。

Meta、AIで写真の上下を生成して縦長にする機能・画像生成AIのウェブサービスなど公開。見えない電子透かしを追加 画像
AI

Meta、AIで写真の上下を生成して縦長にする機能・画像生成AIのウェブサービスなど公開。見えない電子透かしを追加

Metaは12月6日(現地時間)、同社の画像生成AI「Imagine」のウェブ版(imagine.meta.com)を公開しました。サイトは日本語化されていますが、残念ながらいまのところ利用できるのは米国のみとなっています。

グラビアカメラマンが教える、生成AIグラビア実践ワークショップ(第3回)参加者募集。過去回アーカイブも視聴できます 画像
AI

グラビアカメラマンが教える、生成AIグラビア実践ワークショップ(第3回)参加者募集。過去回アーカイブも視聴できます

人気連載「生成AIグラビアをグラビアカメラマンが作るとどうなる?」の著者である西川和久さんを講師に迎えた、生成AIグラビアワークショップの第3回を12月21日に開催いたします。なお、今回お申し込みいただいた方は、第2回分の動画アーカイブを視聴いただけます。

Google Pixel向け12月Feature Drop発表。動画ブーストやっと提供、Pixel 8 Proは初のGemini Nano対応スマホに 画像
スマートフォン

Google Pixel向け12月Feature Drop発表。動画ブーストやっと提供、Pixel 8 Proは初のGemini Nano対応スマホに

Googleは12月6日(現地時間)、新しいAIモデル「Gemini」を発表しました。用途に応じてUltra、Pro、Nanoという3つのバージョンが用意されており、その中でモバイル機器向けとなるGemini NanoをPixel 8 Proに展開することも発表されています。

Google、新AIモデル「Gemini」発表。動画もネイティブに理解するマルチモーダル、Pixel 8 Proにも導入へ 画像
AI

Google、新AIモデル「Gemini」発表。動画もネイティブに理解するマルチモーダル、Pixel 8 Proにも導入へ

日本時間12月7日、Googleは新開発のAIモデル「Gemini」を発表しました。モバイル機器からデータセンターまで、あらゆる用途に対応すべく、Gemini Ultra、Gemini Pro、Gemini Nanoの3種類を用意しています。

AIで「普通のおじさん」を生成したフェイク新聞の作り方。そこから考える「普通」への疑い 画像
AI

AIで「普通のおじさん」を生成したフェイク新聞の作り方。そこから考える「普通」への疑い

生成AIの出力画像を元にCGで作った新聞っぽいフェイク画像をXに投稿したところ、想像以上の反響がありました。気軽な実験のつもりで説明も雑過ぎたため、伝わりにくかったり誤解されたりした部分もあるようです。どのように、なぜ作ったのか補足します。

現実の魔法具、iPhoneサイズの立体映像装置「Looking Glass Go」。2台も買って何をするのか(CloseBox) 画像
AI

現実の魔法具、iPhoneサイズの立体映像装置「Looking Glass Go」。2台も買って何をするのか(CloseBox)

手のひらに乗る立体視ディスプレイ「Looking Glass Go」を2台買ってしまいました。その理由は……。

マイクロソフトのSeeing AIアプリ、Android向けにもリリース。スマホカメラを向けると周囲の様子を音声で説明 画像
AI

マイクロソフトのSeeing AIアプリ、Android向けにもリリース。スマホカメラを向けると周囲の様子を音声で説明

Microsoftは12月4日(現地時間)、国際障害者デー(12月3日)を記念して、スマートフォンのカメラを向けたものを音声で説明するアプリ「Seeing AI」のAndroid版をリリースしました。

画像内のキャラを思うがままに抜群の精度で動かせる「Animate Anyone」、話した声をすぐに翻訳するMeta「Seamless」など重要論文5本を解説(生成AIウィークリー) 画像
AI

画像内のキャラを思うがままに抜群の精度で動かせる「Animate Anyone」、話した声をすぐに翻訳するMeta「Seamless」など重要論文5本を解説(生成AIウィークリー)

先週大きな話題となった、画像内のキャラクターや写真内の人物を骨格動画に応じて動かせる「Animate Anyone」など5本の生成AI論文を紹介。

ChatGPTに同じ言葉を連呼させると、壊れて学習データ(個人情報入り)を吐き出す?Google DeepMind研究者らのチームが論文発表 画像
AI

ChatGPTに同じ言葉を連呼させると、壊れて学習データ(個人情報入り)を吐き出す?Google DeepMind研究者らのチームが論文発表

Google DeepMindや複数の大学の研究者からなるチームが、AI企業に対し、単純な攻撃がプライバシー関連の問題を起こす可能性があるとして、大規模言語モデル(LLM)をリリースする前に内部や第三者による安全性テストを実施するよう求めています。

アマゾン、数千億~数兆パラメータの生成AIトレーニングに最適化した独自プロセッサ「AWS Trainium2」発表。性能は初代比最大4倍 画像
AI

アマゾン、数千億~数兆パラメータの生成AIトレーニングに最適化した独自プロセッサ「AWS Trainium2」発表。性能は初代比最大4倍

Amazon Web Services(AWS)は、ラスベガスで開催中のイベント「AWS re:Invent 2023」の基調講演で、AIのトレーニングに最適化した独自プロセッサ「AWS Trainium2」を発表しました。

アマゾン、企業向けAIチャットボット「Q」発表。様々なビジネスソフトと連携 画像
AI

アマゾン、企業向けAIチャットボット「Q」発表。様々なビジネスソフトと連携

米アマゾンは11月28日、企業向けのAIチャットボット「Q」を発表しました。AWSの機能を熟知しており、関連サービスを利用している顧客が問題に遭遇した際に、自然言語で解決策を問い合わせることが可能になります。

AI向けに改造されたGeForce RTX 4090の写真が中国で公開。米国による輸出禁止前の駆け込み需要か 画像
PC

AI向けに改造されたGeForce RTX 4090の写真が中国で公開。米国による輸出禁止前の駆け込み需要か

米国政府はAIや機械学習に使われるGPUにつき、中国への輸出規制を強化しつつあります。その範囲は次第に拡大し、ついにNVIDIAの最新GPUであるRTX 4090にまで及びました。本来はゲーム用ではありますが、非常に高い演算能力を誇り、当然AI用途にも転用できるためです。

Humaneのバッジ型AIウェアラブル「Ai Pin」を注文してわかったこと。米国外で使える? アクセサリは? 画像
AI

Humaneのバッジ型AIウェアラブル「Ai Pin」を注文してわかったこと。米国外で使える? アクセサリは?

元アップル社員が開発し、OpenAIのサム・アルトマンも出資したと話題になっていたAIウェアラブルがついに発売(米国のみ)。これを購入できた五島正浩さんに、購入時の様子をレポートしてもらいました。

Inter BEEとAdobe MAXに見る、映像業界の変遷とAIへの取り組み(小寺信良) 画像
Film / TV

Inter BEEとAdobe MAXに見る、映像業界の変遷とAIへの取り組み(小寺信良)

Inter BEE 2023とAdobe MAXを取材した小寺信良さんが感じた、業界の変化とAIについて。

AIが間違えやすい「指の数」を修正する技術、Stability AIの動画生成AI「Stable Video Diffusion」など重要論文5本を解説(生成AIウィークリー) 画像
AI

AIが間違えやすい「指の数」を修正する技術、Stability AIの動画生成AI「Stable Video Diffusion」など重要論文5本を解説(生成AIウィークリー)

発表以来大きな話題となっている、Stability AIの動画生成AIモデルなど、5本の生成AI論文を解説。

GoogleのAI「Bard」、人間の代わりにYouTubeを見て内容を回答可能に。料理動画からレシピを要約も 画像
AI

GoogleのAI「Bard」、人間の代わりにYouTubeを見て内容を回答可能に。料理動画からレシピを要約も

GoogleはAIチャットボット「Bard」をアップデートし、YouTube動画を理解できる最初の一歩を踏み出したと発表しました。

サム・アルトマン氏、OpenAIのCEOとして復帰。取締役会も刷新 画像
AI

サム・アルトマン氏、OpenAIのCEOとして復帰。取締役会も刷新

先週末にOpenAIから解任された、共同創業者のサム・アルトマン氏がCEOとして復帰することが決まりました。

スマホ版ChatGPTの音声会話機能が無料ユーザーに開放。退社したブロックマン元社長もお勧め 画像
AI

スマホ版ChatGPTの音声会話機能が無料ユーザーに開放。退社したブロックマン元社長もお勧め

OpenAIは元CEOサム・アルトマン氏の去就をめぐり大変なことになっているさなか、ChatGPTモバイルアプリの音声会話機能を無料ユーザーも利用可能にしたと発表しました。

マイクロソフト、OpenAI従業員に現在と同額の報酬で入社可能と述べる 画像
AI

マイクロソフト、OpenAI従業員に現在と同額の報酬で入社可能と述べる

マイクロソフトの最高技術責任者(CTO)ケヴィン・スコット氏はOpenAIの従業員に対し、もしマイクロソフトに移るのであれば、現在のOpenAIで得ているのと同額の報酬で雇用する考えを示しました。

OpenAIのほぼ全従業員、現取締役会に退陣とアルトマン氏復帰求める公開書簡。一方アルトマン氏も再び復帰を模索か 画像
AI

OpenAIのほぼ全従業員、現取締役会に退陣とアルトマン氏復帰求める公開書簡。一方アルトマン氏も再び復帰を模索か

OpenAI従業員の大半は、取締役会に宛てた書簡のなかで、解任した元CEOのサム・アルトマン氏が復帰しないのであればOpenAIを退職する意向を示しました。一方アルトマン氏は未だOpenAIに戻る可能性を捨てきってはいない様子であることが新たに伝えられています。

マイクロソフト、OpenAIと元OpenAIの両方を手に入れる。OpenAI創業者のアルトマン氏は、マイクロソフトの新しいAI研究チームトップに 画像
AI

マイクロソフト、OpenAIと元OpenAIの両方を手に入れる。OpenAI創業者のアルトマン氏は、マイクロソフトの新しいAI研究チームトップに

マイクロソフトのサティア・ナデラCEOによる投稿で、OpenAIお家騒動は一件落着となりました。

サム・アルトマン氏、OpenAIに復帰せずマイクロソフト入り。新・暫定CEOにはTwitch共同創業者エメット・シア氏 画像
AI

サム・アルトマン氏、OpenAIに復帰せずマイクロソフト入り。新・暫定CEOにはTwitch共同創業者エメット・シア氏

OpenAIの共同創設者兼取締役のイリヤ・サツケヴァー氏は、解任したCEOサム・アルトマン氏は協議の末OpenAIに戻らず、復帰の予定がないことを明らかにしました。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第13回:SDXLでのControlNet活用方法その1+α版(西川和久) 画像
Science

生成AIグラビアをグラビアカメラマンが作るとどうなる?第13回:SDXLでのControlNet活用方法その1+α版(西川和久)

第9回にFooocus-MREを使ってControlNetをご紹介したが、一般的なAUTOMATIC1111での説明はまだだったので、改めて今回と次回で行いたい。

CEOを解任されたサム・アルトマン氏、OpenAI本社での写真を投稿。「もうゲストで入ることはない」の意味するところは? 画像
AI

CEOを解任されたサム・アルトマン氏、OpenAI本社での写真を投稿。「もうゲストで入ることはない」の意味するところは?

OpenAIのCEOを追われたサム・アルトマン氏が「これ(OpenAIのゲストタグ)を着けるのはこれが最初で最後」という写真をXに投稿しました。

入力テキストを実写アバターに話させるツールをMicrosoftが発表、擬人化キャラの外見や性格を文章で作り出す「ChatAnything」など重要論文5本を解説(生成AIウィークリー) 画像
AI

入力テキストを実写アバターに話させるツールをMicrosoftが発表、擬人化キャラの外見や性格を文章で作り出す「ChatAnything」など重要論文5本を解説(生成AIウィークリー)

生成AIの最新トレンドを追いかける連載。今回は入力テキストを実写アバターに話させるツール、擬人化キャラの外見や性格を文章で作り出す技術など重要論文5本を解説します。

OpenAI取締役会、解任したサム・アルトマン氏にCEO復帰求め協議中との報 画像
AI

OpenAI取締役会、解任したサム・アルトマン氏にCEO復帰求め協議中との報

OpenAIは、この週末に解任したサム・アルトマン氏に対して、CEOに復帰することを求めて協議しています。

OpenAIサム・アルトマンCEOが退社、事実上の追放。取締役会「意思疎通が不誠実と判断」 画像
AI

OpenAIサム・アルトマンCEOが退社、事実上の追放。取締役会「意思疎通が不誠実と判断」

ChatGPTやDALL・E等の生成AIサービスで知られるOpenAI社が、CEOサム・アルトマン氏の退社を発表しました。

『Japanese Stable Diffusion XL』公開。日本語プロンプトで日本文化を反映した画像出力 画像
AI

『Japanese Stable Diffusion XL』公開。日本語プロンプトで日本文化を反映した画像出力

日本の文化・アートを日本語の入力で高品質に出力できる画像生成AIが、Stability AIから公開されました。

ローコード開発ツール「Copilot Studio」発表。Copilotのカスタマイズ、プラグイン開発、ワークフロー設定などが可能に(Microsoft Ignite 2023) 画像
AI

ローコード開発ツール「Copilot Studio」発表。Copilotのカスタマイズ、プラグイン開発、ワークフロー設定などが可能に(Microsoft Ignite 2023)

マイクロソフトは開催中の年次イベント「Microsoft Ignite 2023」で、同社のAIサービスであるCopilotのカスタマイズやプラグイン開発、ワークフローの設定、データソースとの接続などを含むさまざまな開発を可能にするローコード開発ツール「Copilot Studio」を発表しました。

GoogleフォトがAI機能強化。「ほぼ同じ写真」をスタック整理、カレンダーに自動予定追加 画像
AI

GoogleフォトがAI機能強化。「ほぼ同じ写真」をスタック整理、カレンダーに自動予定追加

Googleは、写真ライブラリーの中にあるほとんど同じ写真を整理するための新しいAI機能を発表しました。

「Bing Chat」が「Copilot」にリブランディング。Edge以外のブラウザ、モバイルでも利用可能に(Microsoft Ignite 2023) 画像
AI

「Bing Chat」が「Copilot」にリブランディング。Edge以外のブラウザ、モバイルでも利用可能に(Microsoft Ignite 2023)

マイクロソフトはこれまで「Bing Chat」および企業向けに「Bing Chat Enterprise」の呼称で提供してきたAIサービスを「Copilot」にリブランディングし、同社のAIサービス全体の体験を「Microsoft Copilot」で統一します。

グラビアカメラマンが教える、生成AIグラビア実践ワークショップ(第2回)を開催します 画像
AI

グラビアカメラマンが教える、生成AIグラビア実践ワークショップ(第2回)を開催します

人気連載「生成AIグラビアをグラビアカメラマンが作るとどうなる?」の著者である西川和久さんを講師に迎えた、生成AIグラビアワークショップの第2回を11月22日に開催いたします。

AIで蘇る、伝説の歌手エディット・ピアフの声と姿。伝記映画「EDITH」のナレーションも 画像
AI

AIで蘇る、伝説の歌手エディット・ピアフの声と姿。伝記映画「EDITH」のナレーションも

伝説的歌手であるエディット・ピアフが遺した声を元にしたAIボイスによりナレーションが行われることが発表されました。