AI

“最適化”した回答を出すGoogleの言語モデル「OPRO」、3D都市を無制限に生成するAI「CityDreamer」など重要論文5本を解説(生成AIウィークリー) 画像
AI

“最適化”した回答を出すGoogleの言語モデル「OPRO」、3D都市を無制限に生成するAI「CityDreamer」など重要論文5本を解説(生成AIウィークリー)

1週間分のAI論文をまとめる生成AIウィークリーは、“最適化”した回答を出すGoogleの言語モデル「OPRO」、無制限に3D都市を生成するAI「CityDreamer」など重要論文5本を解説しています。

サンフランシスコ消防局、要救護者の死亡はロボタクシーが救急車の道を塞いでいたせいだと批判。一方、Cruiseは反論 画像
Mobility

サンフランシスコ消防局、要救護者の死亡はロボタクシーが救急車の道を塞いでいたせいだと批判。一方、Cruiseは反論

先月、サンフランシスコで発生した救急搬送患者の死亡例に関して、サンフランシスコ消防局はロボタクシーが道路を塞いでいたせいで、救急車の現場への到着および要救護者の搬出が遅れたと主張しています。

妻の歌声を合成して10年が経って、本人不在のミュージックビデオがAIでこんな感じになりました(CloseBox) 画像
AI

妻の歌声を合成して10年が経って、本人不在のミュージックビデオがAIでこんな感じになりました(CloseBox)

9月はいろいろ個人的なイベントがあります。自分の誕生日と、その前日の結婚記念日がまずあって、まあそれはもう誰も祝う人がいないので一人でケーキを買ってきたり英国リバプールの郷土料理であるスカウスを、クックパッドに残された妻のレシピで作ったりしています。

1本50円で外注できるAIソフトウェア開発環境「ChatDEV」、人の声を理解する言語モデル「LLaSM」など重要論文5本を解説(生成AIウィークリー) 画像
AI

1本50円で外注できるAIソフトウェア開発環境「ChatDEV」、人の声を理解する言語モデル「LLaSM」など重要論文5本を解説(生成AIウィークリー)

先週発表されたAI関連論文から、50円で外注できるAIソフトウェア開発会社「ChatDEV」、人の声を理解する言語モデル「LLaSM」など5本を解説します。

これが新しいAIググる体験か。Googleの生成AI検索「SGE」、日本語実験の現在地(Google Tales) 画像
AI

これが新しいAIググる体験か。Googleの生成AI検索「SGE」、日本語実験の現在地(Google Tales)

待望の「Search Generative Experience」が8月30日に日本とインドでも使えるようになりました。5月から使えていた米国以外で使えるようになったのは、今のところこの2カ国のみだそうです。

Google、生成AIによる検索「SGE」を日本でも試験開始。質問に文章で回答、会話形式で再検索も 画像
Other

Google、生成AIによる検索「SGE」を日本でも試験開始。質問に文章で回答、会話形式で再検索も

Googleが2023年5月のGoogle I/Oで発表し、米国で先行して実施していた生成AIによる検索体験(SGE:Search Generative Experience)の試験運用を日本とインドでも開始しました。デスクトップのChromeブラウザとAndroidおよびiOSのGoogleアプリで利用できます。

Google「Duet AI」サービス多数発表。Gmail代筆やMeet議事録、データ分析からコード生成まで全面採用(Google Cloud Next '23) 画像
AI

Google「Duet AI」サービス多数発表。Gmail代筆やMeet議事録、データ分析からコード生成まで全面採用(Google Cloud Next '23)

開催中のイベント「Google Cloud Next '23」で発表されたサービス群の刷新はAI「Duet AI」を冠したものだ。

Uber Eats、予算や好みでおすすめメニュー提示する注文支援AIチャットボットを開発中との報 画像
AI

Uber Eats、予算や好みでおすすめメニュー提示する注文支援AIチャットボットを開発中との報

Uberは、フードデリバリーサービスのUber Eatsに注文支援用AIチャットボットの導入を計画している模様です。

3秒の音声があれば本人そっくりの声で日本語・英語・中国語合成できる「VALL-E X」はやはり脅威。MSが非公開にした技術のOSS版を試して実感した(CloseBox) 画像
AI

3秒の音声があれば本人そっくりの声で日本語・英語・中国語合成できる「VALL-E X」はやはり脅威。MSが非公開にした技術のOSS版を試して実感した(CloseBox)

「使い方を誤ればティープフェイクの音声版にもなり得る」とまでマイクロソフトが危険視していた技術が別の開発者によってオープンソース公開されました。

Metaが文章と音声を翻訳するオールインワンAI「SeamlessM4T」、コード専用生成AI「Code Llama」を投入するなど重要論文5本を解説(生成AIウィークリー) 画像
AI

Metaが文章と音声を翻訳するオールインワンAI「SeamlessM4T」、コード専用生成AI「Code Llama」を投入するなど重要論文5本を解説(生成AIウィークリー)

Metaが文章と音声を翻訳するAI「SeamlessM4T」、コード専用生成AI「Code Llama」投入するなど、生成AIに関する重要論文5本を解説します。

無料で25人のAIシンガー使い放題なボーカロイド「VOCALOID β-STUDIO」はどこが画期的なのか、パラメータ1つで歌ってもらってわかったこと(CloseBox) 画像
Music

無料で25人のAIシンガー使い放題なボーカロイド「VOCALOID β-STUDIO」はどこが画期的なのか、パラメータ1つで歌ってもらってわかったこと(CloseBox)

ヤマハの「VOCALOID β-STUDIO」を実際に使ってみました。まだ半日程度ですが、いくつかわかったことがあります。

期間限定・無料で25人分のAIシンガーが使える試作品ボカロの受付開始。VOCALOID β-STUDIO、始まる(CloseBox) 画像
Music

期間限定・無料で25人分のAIシンガーが使える試作品ボカロの受付開始。VOCALOID β-STUDIO、始まる(CloseBox)

これまで作品を作ってきたボカロPは、ヤマハの新しいVOCALOID技術を無償で試すチャンス。「VOCALOID β-STUDIO」の参加受付が始まりました。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第六回:Stable Diffusionの基本2 / LoRAの概要と6つの例を紹介 (西川和久) 画像
AI

生成AIグラビアをグラビアカメラマンが作るとどうなる?第六回:Stable Diffusionの基本2 / LoRAの概要と6つの例を紹介 (西川和久)

前回はモデルの1つであるCheckpointについていろいろお話した。今回はStable Diffusionが扱えるモデルの中で次によく使われるLoRAについてがお題となる。

好きな人の声で好きな文章を読ませるMicrosoftの音声AI「SpeechX」、映像から3Dシーンを生成するNVIDIA開発「Neuralangelo」のコード公開など重要論文5本を解説(生成AIウィークリー) 画像
AI

好きな人の声で好きな文章を読ませるMicrosoftの音声AI「SpeechX」、映像から3Dシーンを生成するNVIDIA開発「Neuralangelo」のコード公開など重要論文5本を解説(生成AIウィークリー)

今週の生成AI注目論文は、任意の人の音声を合成できるマイクロソフトのText-to-Speechモデルなど5本です。

Web3・NFT・メタバースが「幻滅期」入り 「日本における未来志向型インフラ・テクノロジのハイプ・サイクル:2023年」発表 画像
AI

Web3・NFT・メタバースが「幻滅期」入り 「日本における未来志向型インフラ・テクノロジのハイプ・サイクル:2023年」発表

ガートナーのハイプサイクル、日本ではWeb3、NFT、メタバースが「幻滅期」入りしました。

生成AIは「過度な期待のピーク」期に。米ガートナー「先進テクノロジーのハイプサイクル2023年」を発表 画像
AI

生成AIは「過度な期待のピーク」期に。米ガートナー「先進テクノロジーのハイプサイクル2023年」を発表

ガートナーのハイプサイクル。今年はすでに多くのITエンジニアに聞き馴染みのあるキーワードが比較的保守的といえる場所に並んでいます。

Google、見ているページを生成AIで要約する新機能のテスト開始。長文記事も箇条書きとQA形式に変換 画像
AI

Google、見ているページを生成AIで要約する新機能のテスト開始。長文記事も箇条書きとQA形式に変換

Googleは米国にて、iOSおよびAndroid用のGoogleアプリ内で、閲覧中のサイトにある長文を箇条書きに要約してくれる「SGE while browsing(ブラウジング中のSGE)」機能の初期テストを始めました。

25体の自律AIが住む街がオープンソース化、チラつき抑えた動画合成を生成するAI「DiffSynth」など重要論文5本を解説(生成AIウィークリー) 画像
AI

25体の自律AIが住む街がオープンソース化、チラつき抑えた動画合成を生成するAI「DiffSynth」など重要論文5本を解説(生成AIウィークリー)

1週間分の生成AI主要論文を紹介する連載。今回は、25体の自律AIが住む町、“ちらつき”を抑えた動画合成を生成するAIなど。

AI動画が簡単に作れる「AnimateDiff」を試したらやりがい爆上がり。カスタム学習したあの子が自然に動いてるよ(CloseBox) 画像
AI

AI動画が簡単に作れる「AnimateDiff」を試したらやりがい爆上がり。カスタム学習したあの子が自然に動いてるよ(CloseBox)

最近AnimateDiffというAI動画手法がすごいと各所で注目されています。

食品配達ロボ襲撃の動画がSNSで大バズするも、「99.9%以上は配達成功」と事業者語る 画像
Mobility

食品配達ロボ襲撃の動画がSNSで大バズするも、「99.9%以上は配達成功」と事業者語る

ロサンゼルスの一部地域では、昨年からロボット関連のスタートアップ企業数社によって、フードデリバリーロボットを使った食品配達がテストされています。

NVIDIAがHugging Faceと提携。AIモデルを選んでそのままNVIDIA DGXクラウドで学習可能に 画像
AI

NVIDIAがHugging Faceと提携。AIモデルを選んでそのままNVIDIA DGXクラウドで学習可能に

NVIDIAが生成AIに関わる人なら必ずお世話になっているHugging Faceと提携しました。そこで提供するのはTraining Cluster as a Serviceと呼ばれるものです。

Bing AIチャットがChromeやSafariほか他社ブラウザで利用可能に。会話ターン数や履歴保存に制限 画像
AI

Bing AIチャットがChromeやSafariほか他社ブラウザで利用可能に。会話ターン数や履歴保存に制限

マイクロソフトはOpenAIのAI言語モデルを統合したBing Chatを、まもなくサードパーティ製Webブラウザにも提供することを発表しました。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第五回:Stable Diffusionの基本1 / Checkpointとリアル系モデルの遷移 (西川和久) 画像
AI

生成AIグラビアをグラビアカメラマンが作るとどうなる?第五回:Stable Diffusionの基本1 / Checkpointとリアル系モデルの遷移 (西川和久)

Checkpointとは!?

盗作を回避する音楽生成AI「MusicLDM」、AIたちが協力しゲーム開発する「MetaGPT」、など重要論文5本を解説(生成AIウィークリー) 画像
AI

盗作を回避する音楽生成AI「MusicLDM」、AIたちが協力しゲーム開発する「MetaGPT」、など重要論文5本を解説(生成AIウィークリー)

盗作をできるだけ避けて音楽生成するAI、複数のLLMが協力してソフトウェア開発を行うフレームワークなど、最新のAI論文5つを紹介します。

「明日」テーマにAIを活用したアート作品を募集。第二回AIアートグランプリ、開催決定 画像
AI

「明日」テーマにAIを活用したアート作品を募集。第二回AIアートグランプリ、開催決定

「第二回AIアートグランプリ」は第一回と同じ審査員構成ですが、今回は作品テーマが「明日」と決められています。

「ラブコメのラジオドラマを書いて」で自動生成するAI「WavJourney」、複数回の対話で画像生成できる「LLM-grounded Diffusion」など重要論文5本を解説(生成AIウィークリー) 画像
AI

「ラブコメのラジオドラマを書いて」で自動生成するAI「WavJourney」、複数回の対話で画像生成できる「LLM-grounded Diffusion」など重要論文5本を解説(生成AIウィークリー)

ラジオドラマの番組を自動生成できる大規模言語モデルなど、最新の生成AI関連の重要論文を5本、紹介します。

AI時代の超高速イーサネット規格策定へ Ultra EthernetコンソーシアムをAMD、インテル、シスコ、マイクロソフトなど9社が設立 画像
AI

AI時代の超高速イーサネット規格策定へ Ultra EthernetコンソーシアムをAMD、インテル、シスコ、マイクロソフトなど9社が設立

イーサネットの仕様を改善し、AIやハイパフォーマンスコンピューティング(HPC)のような高速かつ大規模なデータ処理に適した、より高速なイーサネットの実現を目指す団体「Ultra Ethernetコンソーシアム」が発足しました。

高品質画像生成AI「SDXL 1.0」リリース!導入方法と作例 (連載:生成AIグラビアをグラビアカメラマンが作るとどうなる? 第四回 西川和久) 画像
Science

高品質画像生成AI「SDXL 1.0」リリース!導入方法と作例 (連載:生成AIグラビアをグラビアカメラマンが作るとどうなる? 第四回 西川和久)

SDXL 1.0リリース!

OpenAI、Android版ChatGPT公式アプリ配信開始。日本向けは事前登録中 画像
AI

OpenAI、Android版ChatGPT公式アプリ配信開始。日本向けは事前登録中

OpenAIは7月26日、ChatGPTのAndroid版をリリースしました。現在、米国、インド、バングラデシュ、ブラジルでダウンロード可能となっており、来週以降さらに多くの国への展開を予定しているとのことです。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第三回:実際の撮影とポーズ/構図の関係。openpose_handで指問題解決? (西川和久) 画像
Science

生成AIグラビアをグラビアカメラマンが作るとどうなる?第三回:実際の撮影とポーズ/構図の関係。openpose_handで指問題解決? (西川和久)

実際の撮影と呪文の関係は似てる!?

自称Transformer後継モデル「RetNet」マイクロソフトら開発、脳活動から音楽を生成するAI「Brain2Music」など重要論文5本を解説(生成AIウィークリー) 画像
AI

自称Transformer後継モデル「RetNet」マイクロソフトら開発、脳活動から音楽を生成するAI「Brain2Music」など重要論文5本を解説(生成AIウィークリー)

Transformerより学習速度が速く、低遅延で、メモリ効率にも優れ、同等性能以上の精度を示すという「Transformerの後継モデル」をマイクロソフトらが発表しました。

Android版ChatGPTアプリは来週配信、OpenAIが告知「GPT-4の頭が劣化」指摘にも回答 画像
AI

Android版ChatGPTアプリは来週配信、OpenAIが告知「GPT-4の頭が劣化」指摘にも回答

OpenAIが、Android版のChatGPTアプリを来週リリースするとツイートしました。iOS版は5月にリリースされ、当時Android版については「まもなく」とアナウンスしていましたが、感覚的にはわりと長い間が開いてのリリースとなります。

テスラのマスクCEO、自動運転技術のOEM供給に向け自動車メーカーと「初期の協議中」と発言 画像
Mobility

テスラのマスクCEO、自動運転技術のOEM供給に向け自動車メーカーと「初期の協議中」と発言

イーロン・マスク氏は、先頃行われたテスラの決算報告において、テスラのAutopilot / Full Self-Driving(FSD)技術のライセンス供与について「大手」自動車メーカーと「初期の協議」を行っていることを明らかにしました。

アップル、独自の大規模言語モデル「Apple GPT」を社内でテスト中?製品組み込みは慎重、2024年には発表の可能性(Bloomberg報道) 画像
AI

アップル、独自の大規模言語モデル「Apple GPT」を社内でテスト中?製品組み込みは慎重、2024年には発表の可能性(Bloomberg報道)

マイクロソフトやGoogle等が生成系AIの市場を開拓している一方で、アップルは6月の世界開発者会議WWDC基調講演で「AI」という言葉を極力避けていた(「機械学習」や「ML」は使用)が注目を集めていました。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第二回:「アジア美女」最新モデルBRAV6作例とネガティブプロンプトの基礎 画像
AI

生成AIグラビアをグラビアカメラマンが作るとどうなる?第二回:「アジア美女」最新モデルBRAV6作例とネガティブプロンプトの基礎

グラビアカメラマンでありソフトウェアエンジニアでもある西川和久氏が、プロカメラマンの目線から画像生成AIによる実写風ポートレートを作成する連載の第二回をお届けします。

1枚の静止画から動画作成する「AnimateDiff」、Googleの画像学習改良版「HyperDreamBooth」など5本の重要論文を解説(生成AIウィークリー) 画像
AI

1枚の静止画から動画作成する「AnimateDiff」、Googleの画像学習改良版「HyperDreamBooth」など5本の重要論文を解説(生成AIウィークリー)

人物画像などの学習によく使われているDreamBoothを、開発元であるGoogleがさらに高速化。静止画1枚から一貫性のあるアニメーションを制作する手法など、最新論文から生成AIの重要技術5つを紹介。

チャットAIで画像入力が可能に。ChatGPTより一足早くやってきたGoogle Bardマルチモーダルの使い方(Google Tales) 画像
AI

チャットAIで画像入力が可能に。ChatGPTより一足早くやってきたGoogle Bardマルチモーダルの使い方(Google Tales)

GoogleのチャットAI「Bard」がChatGPTより先に画像入力に対応しました。日本語ではまだですが、設定方法などの使い方をまとめました。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第一回:実在モデルで学習・LoRAでキャッチライト付加  (西川和久) 画像
AI

生成AIグラビアをグラビアカメラマンが作るとどうなる?第一回:実在モデルで学習・LoRAでキャッチライト付加 (西川和久)

ベテランのグラビアカメラマンである西川和久氏がAIグラビア生成を始め、撮影した実在モデルの写真から本人了承のもとトレーニングまでしていると聞き、始めたきっかけやAIとの付き合い方、始めてみたい人へのTIPSをまとめてもらいました。(編集部)

生成AIをどう学習に利用するか。より具体的な議論になってきた(小寺信良) 画像
AI

生成AIをどう学習に利用するか。より具体的な議論になってきた(小寺信良)

教育界は今、生成AIの出現によって大きく動き始めようとしている。英国ではすでに教員が授業計画の作成や採点にAI技術を活用しており、機会も課題ももたらすものという認識を示した。

10億トークンを処理できるマイクロソフトの言語生成AI「LongNet」、喉のMRIからAI音声合成など5つの重要論文を解説(生成AIウィークリー) 画像
AI

10億トークンを処理できるマイクロソフトの言語生成AI「LongNet」、喉のMRIからAI音声合成など5つの重要論文を解説(生成AIウィークリー)

毎週月曜日に、前週の重要な生成AI論文をピックアップする連載。第2回は、トークン数を10億にまで拡張できるAIモデルなどをセレクトして解説します。

AI翻訳のDeepLが「DeepL Japan 合同会社」設立、欧州以外で初の海外拠点 画像
AI

AI翻訳のDeepLが「DeepL Japan 合同会社」設立、欧州以外で初の海外拠点

7月3日、AIを使ったオンライン翻訳サービスを展開する独DeepLが、日本法人「DeepL Japan 合同会社」を設立したと発表しました。

「英語は新しいプログラミング言語、生成的AIは新しいコンパイラ」。SDK「English SDK for Apache Spark」とは何か 画像
AI

「英語は新しいプログラミング言語、生成的AIは新しいコンパイラ」。SDK「English SDK for Apache Spark」とは何か

「英語」をApache Sparkの問い合わせ言語にできるSDK「English SDK for Apache Spark」について解説します。