
忘れられない人とのデュエットが、映像でも。それを実現してくれたAIサービス「HeyGen」のさらなる野望(CloseBox)
静止画とオーディオがあればリップシンクができる動画技術を使い、長年の夢を実現しました。その一方で、ディープフェイク悪用の可能性がある技術も登場しています。

生成AIに高校スポーツ記事を書かせた大手新聞社、誤りや品質の苦情続き一時取り下げ。所属記者も「掲載すべきでなかった」と発言
米国の新聞社Gannettは8月、AIが生成した地域の高校スポーツ大会の結果を伝える複数の記事が、非常に不自然な文章構成になっていたり、誤りや文章生成に失敗していると読者から指摘され問題化したのを受け、該当する記事のチェックと更新を行っています。

“最適化”した回答を出すGoogleの言語モデル「OPRO」、3D都市を無制限に生成するAI「CityDreamer」など重要論文5本を解説(生成AIウィークリー)
1週間分のAI論文をまとめる生成AIウィークリーは、“最適化”した回答を出すGoogleの言語モデル「OPRO」、無制限に3D都市を生成するAI「CityDreamer」など重要論文5本を解説しています。

これが新しいAIググる体験か。Googleの生成AI検索「SGE」、日本語実験の現在地(Google Tales)
待望の「Search Generative Experience」が8月30日に日本とインドでも使えるようになりました。5月から使えていた米国以外で使えるようになったのは、今のところこの2カ国のみだそうです。

Google、生成AIによる検索「SGE」を日本でも試験開始。質問に文章で回答、会話形式で再検索も
Googleが2023年5月のGoogle I/Oで発表し、米国で先行して実施していた生成AIによる検索体験(SGE:Search Generative Experience)の試験運用を日本とインドでも開始しました。デスクトップのChromeブラウザとAndroidおよびiOSのGoogleアプリで利用できます。

Google「Duet AI」サービス多数発表。Gmail代筆やMeet議事録、データ分析からコード生成まで全面採用(Google Cloud Next '23)
開催中のイベント「Google Cloud Next '23」で発表されたサービス群の刷新はAI「Duet AI」を冠したものだ。

Uber Eats、予算や好みでおすすめメニュー提示する注文支援AIチャットボットを開発中との報
Uberは、フードデリバリーサービスのUber Eatsに注文支援用AIチャットボットの導入を計画している模様です。

3秒の音声があれば本人そっくりの声で日本語・英語・中国語合成できる「VALL-E X」はやはり脅威。MSが非公開にした技術のOSS版を試して実感した(CloseBox)
「使い方を誤ればティープフェイクの音声版にもなり得る」とまでマイクロソフトが危険視していた技術が別の開発者によってオープンソース公開されました。

Metaが文章と音声を翻訳するオールインワンAI「SeamlessM4T」、コード専用生成AI「Code Llama」を投入するなど重要論文5本を解説(生成AIウィークリー)
Metaが文章と音声を翻訳するAI「SeamlessM4T」、コード専用生成AI「Code Llama」投入するなど、生成AIに関する重要論文5本を解説します。

エアコン「霧ヶ峰」新型は準ミリ波レーダーで脈拍測定し「感情」や集中度を計測、冷風で狙い覚醒促す機能まで。高齢者見守りサービスも(安蔵靖志)
三菱電機は2023年8月21日、ルームエアコン「霧ヶ峰」の最新モデルを発表。翌日に開催されたプライベート展示会ではメディア向けツアーも行われ、同社が2月にスタートした高齢者見守りサービス「MeAMOR」も紹介されました。ここでは注目の製品や機能などを解説します。

無料で25人のAIシンガー使い放題なボーカロイド「VOCALOID β-STUDIO」はどこが画期的なのか、パラメータ1つで歌ってもらってわかったこと(CloseBox)
ヤマハの「VOCALOID β-STUDIO」を実際に使ってみました。まだ半日程度ですが、いくつかわかったことがあります。

期間限定・無料で25人分のAIシンガーが使える試作品ボカロの受付開始。VOCALOID β-STUDIO、始まる(CloseBox)
これまで作品を作ってきたボカロPは、ヤマハの新しいVOCALOID技術を無償で試すチャンス。「VOCALOID β-STUDIO」の参加受付が始まりました。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第六回:Stable Diffusionの基本2 / LoRAの概要と6つの例を紹介 (西川和久)
前回はモデルの1つであるCheckpointについていろいろお話した。今回はStable Diffusionが扱えるモデルの中で次によく使われるLoRAについてがお題となる。

好きな人の声で好きな文章を読ませるMicrosoftの音声AI「SpeechX」、映像から3Dシーンを生成するNVIDIA開発「Neuralangelo」のコード公開など重要論文5本を解説(生成AIウィークリー)
今週の生成AI注目論文は、任意の人の音声を合成できるマイクロソフトのText-to-Speechモデルなど5本です。

Web3・NFT・メタバースが「幻滅期」入り 「日本における未来志向型インフラ・テクノロジのハイプ・サイクル:2023年」発表
ガートナーのハイプサイクル、日本ではWeb3、NFT、メタバースが「幻滅期」入りしました。

生成AIは「過度な期待のピーク」期に。米ガートナー「先進テクノロジーのハイプサイクル2023年」を発表
ガートナーのハイプサイクル。今年はすでに多くのITエンジニアに聞き馴染みのあるキーワードが比較的保守的といえる場所に並んでいます。

Google、見ているページを生成AIで要約する新機能のテスト開始。長文記事も箇条書きとQA形式に変換
Googleは米国にて、iOSおよびAndroid用のGoogleアプリ内で、閲覧中のサイトにある長文を箇条書きに要約してくれる「SGE while browsing(ブラウジング中のSGE)」機能の初期テストを始めました。

25体の自律AIが住む街がオープンソース化、チラつき抑えた動画合成を生成するAI「DiffSynth」など重要論文5本を解説(生成AIウィークリー)
1週間分の生成AI主要論文を紹介する連載。今回は、25体の自律AIが住む町、“ちらつき”を抑えた動画合成を生成するAIなど。

AI動画が簡単に作れる「AnimateDiff」を試したらやりがい爆上がり。カスタム学習したあの子が自然に動いてるよ(CloseBox)
最近AnimateDiffというAI動画手法がすごいと各所で注目されています。

NVIDIAがHugging Faceと提携。AIモデルを選んでそのままNVIDIA DGXクラウドで学習可能に
NVIDIAが生成AIに関わる人なら必ずお世話になっているHugging Faceと提携しました。そこで提供するのはTraining Cluster as a Serviceと呼ばれるものです。

Bing AIチャットがChromeやSafariほか他社ブラウザで利用可能に。会話ターン数や履歴保存に制限
マイクロソフトはOpenAIのAI言語モデルを統合したBing Chatを、まもなくサードパーティ製Webブラウザにも提供することを発表しました。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第五回:Stable Diffusionの基本1 / Checkpointとリアル系モデルの遷移 (西川和久)
Checkpointとは!?

盗作を回避する音楽生成AI「MusicLDM」、AIたちが協力しゲーム開発する「MetaGPT」、など重要論文5本を解説(生成AIウィークリー)
盗作をできるだけ避けて音楽生成するAI、複数のLLMが協力してソフトウェア開発を行うフレームワークなど、最新のAI論文5つを紹介します。

「明日」テーマにAIを活用したアート作品を募集。第二回AIアートグランプリ、開催決定
「第二回AIアートグランプリ」は第一回と同じ審査員構成ですが、今回は作品テーマが「明日」と決められています。

高品質画像生成AI「SDXL 1.0」リリース!導入方法と作例 (連載:生成AIグラビアをグラビアカメラマンが作るとどうなる? 第四回 西川和久)
SDXL 1.0リリース!

OpenAI、Android版ChatGPT公式アプリ配信開始。日本向けは事前登録中
OpenAIは7月26日、ChatGPTのAndroid版をリリースしました。現在、米国、インド、バングラデシュ、ブラジルでダウンロード可能となっており、来週以降さらに多くの国への展開を予定しているとのことです。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第三回:実際の撮影とポーズ/構図の関係。openpose_handで指問題解決? (西川和久)
実際の撮影と呪文の関係は似てる!?

Android版ChatGPTアプリは来週配信、OpenAIが告知「GPT-4の頭が劣化」指摘にも回答
OpenAIが、Android版のChatGPTアプリを来週リリースするとツイートしました。iOS版は5月にリリースされ、当時Android版については「まもなく」とアナウンスしていましたが、感覚的にはわりと長い間が開いてのリリースとなります。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第二回:「アジア美女」最新モデルBRAV6作例とネガティブプロンプトの基礎
グラビアカメラマンでありソフトウェアエンジニアでもある西川和久氏が、プロカメラマンの目線から画像生成AIによる実写風ポートレートを作成する連載の第二回をお届けします。

1枚の静止画から動画作成する「AnimateDiff」、Googleの画像学習改良版「HyperDreamBooth」など5本の重要論文を解説(生成AIウィークリー)
人物画像などの学習によく使われているDreamBoothを、開発元であるGoogleがさらに高速化。静止画1枚から一貫性のあるアニメーションを制作する手法など、最新論文から生成AIの重要技術5つを紹介。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第一回:実在モデルで学習・LoRAでキャッチライト付加 (西川和久)
ベテランのグラビアカメラマンである西川和久氏がAIグラビア生成を始め、撮影した実在モデルの写真から本人了承のもとトレーニングまでしていると聞き、始めたきっかけやAIとの付き合い方、始めてみたい人へのTIPSをまとめてもらいました。(編集部)

生成AIをどう学習に利用するか。より具体的な議論になってきた(小寺信良)
教育界は今、生成AIの出現によって大きく動き始めようとしている。英国ではすでに教員が授業計画の作成や採点にAI技術を活用しており、機会も課題ももたらすものという認識を示した。

10億トークンを処理できるマイクロソフトの言語生成AI「LongNet」、喉のMRIからAI音声合成など5つの重要論文を解説(生成AIウィークリー)
毎週月曜日に、前週の重要な生成AI論文をピックアップする連載。第2回は、トークン数を10億にまで拡張できるAIモデルなどをセレクトして解説します。

AI翻訳のDeepLが「DeepL Japan 合同会社」設立、欧州以外で初の海外拠点
7月3日、AIを使ったオンライン翻訳サービスを展開する独DeepLが、日本法人「DeepL Japan 合同会社」を設立したと発表しました。

Valve、AI生成画像を含むゲームを却下した理由は「訓練データの権利も確保しているか不明のため」
あるインディーゲーム開発者がPCゲームプラットフォームSteamを運営するValveに、AIが生成したアセットを含むゲームを提出したところ、配信を断られたとRedditに投稿しました。

AIが5時間足らずでRISC-V CPUを設計。性能はi486SX程度
中国の研究グループが、AIによる自動化されたCPU設計と称する論文を発表しました。この論文は、わずか5時間足らずで産業グレードのRISC-V CPUを設計できたと報告しています。

「毎日がゲームチェンジャー」の生成AI時代を生き抜くために、1週間分の重要論文をまとめました(新連載・生成AIウィークリー)
1週間分の生成AIに関する重要論文をピックアップして、解説する新連載を、ここにスタートします。

AI文字起こしボイスレコーダーAutoMemoが話者分離に対応、ウェブアプリAutoMemo Homeで機能追加 (石野純也)
ソースネクストは、文字起こし対応のボイスレコーダー「AutoMemo」に、新サービス「AutoMemo Home」を導入します。サービス開始は8月1日を予定しており、AutoMemoユーザーは無料で利用できます。

Windows 3.1版ChatGPT『WinGPT』公開。90年代の知識で答える16bitアプリ
昨年秋以降、ChatGPTなどテキスト生成AIの人気はとどまるところを知らない状態です。今月には、マイクロソフトがWindows 11のCopilot機能にChatGPT技術を統合し、ブラウザーなどだけでなくOSレベルでも生成AIが利用可能になってきました。

ChatGPTで裁判書類生成、嘘判例だらけと気づかず提出した弁護士に罰金5000ドル
5月下旬、裁判用の書類をChatGPTで生成し、きちんと確認せずにそれを裁判所に提出した結果、記述内容が意味不明だったりウソの判例だらけであることが判明したニューヨークの弁護士が、連邦裁判所から罰金5000ドルを言い渡されました。

テレビ取材が自宅に入る。そのために散財した1メートル超縦長ディスプレイと格安デスク(CloseBox)
短期間のうちに3度のテレビ取材を受けた筆者が、そのために購入したものを紹介します。

iOS版ChromeがAIで進化。住所タップでミニGoogleマップ、日付からカレンダー予定、レンズ画像検索の組込みなど
Googleは、iOS用Chromeブラウザに4つの新機能を追加することを発表しました。別のアプリに切り替えることなく、Chrome上でマップの確認やカレンダーイベントの作成、改善された翻訳やGoogleレンズの機能を利用できます。