生成AIの重要論文5本を解説。「数行のコードを足すだけ…」生成画像・動画の品質が向上「FreeU」、LLaMA2を10万トークンに低コストで増やす手法「LongLoRA」など。
OpenAIが、AI画像生成ツールの新バージョン「DALL・E 3」を発表しました。DALL・E 3は、入力したテキスト文を従来より忠実に、生成するアートへ反映することが可能になっています。
サンノゼで開催中のイベント Intel Innovation 2023基調講演より。インテルのゲルシンガーCEOが、最新のクライアントPC向けプロセッサ『Core Ultra』を発表しました。
年に一度の自社イベント Intel Innovation にさきがけて、インテルが2020年代後半の実用化を目指す「ガラス基板」を公開しました。
生成AIの注目すべき論文を解説する連載。今週は、マイクロソフトによる、“好きな人の声”のオーディオブックを電子書籍から作るAI、0.09秒で画像を生成するAI「InstaFlow」など。
この写真は部分的に欠けているけど、残りを見たい。そんな大事な写真をお持ちの方は、Photoshopを使うといいです。
Stable Audioという新しい生成AIサービスが始まりました。さっそく使ってみました。
Pythonの上位互換で高速性をうたう新言語のMojoが、待望のコンパイラ登場となった。ただしLinuxのみ。
静止画とオーディオがあればリップシンクができる動画技術を使い、長年の夢を実現しました。その一方で、ディープフェイク悪用の可能性がある技術も登場しています。
米国の新聞社Gannettは8月、AIが生成した地域の高校スポーツ大会の結果を伝える複数の記事が、非常に不自然な文章構成になっていたり、誤りや文章生成に失敗していると読者から指摘され問題化したのを受け、該当する記事のチェックと更新を行っています。
1週間分のAI論文をまとめる生成AIウィークリーは、“最適化”した回答を出すGoogleの言語モデル「OPRO」、無制限に3D都市を生成するAI「CityDreamer」など重要論文5本を解説しています。
先月、サンフランシスコで発生した救急搬送患者の死亡例に関して、サンフランシスコ消防局はロボタクシーが道路を塞いでいたせいで、救急車の現場への到着および要救護者の搬出が遅れたと主張しています。
9月はいろいろ個人的なイベントがあります。自分の誕生日と、その前日の結婚記念日がまずあって、まあそれはもう誰も祝う人がいないので一人でケーキを買ってきたり英国リバプールの郷土料理であるスカウスを、クックパッドに残された妻のレシピで作ったりしています。
先週発表されたAI関連論文から、50円で外注できるAIソフトウェア開発会社「ChatDEV」、人の声を理解する言語モデル「LLaSM」など5本を解説します。
待望の「Search Generative Experience」が8月30日に日本とインドでも使えるようになりました。5月から使えていた米国以外で使えるようになったのは、今のところこの2カ国のみだそうです。
Googleが2023年5月のGoogle I/Oで発表し、米国で先行して実施していた生成AIによる検索体験(SGE:Search Generative Experience)の試験運用を日本とインドでも開始しました。デスクトップのChromeブラウザとAndroidおよびiOSのGoogleアプリで利用できます。
開催中のイベント「Google Cloud Next '23」で発表されたサービス群の刷新はAI「Duet AI」を冠したものだ。
Uberは、フードデリバリーサービスのUber Eatsに注文支援用AIチャットボットの導入を計画している模様です。
「使い方を誤ればティープフェイクの音声版にもなり得る」とまでマイクロソフトが危険視していた技術が別の開発者によってオープンソース公開されました。
Metaが文章と音声を翻訳するAI「SeamlessM4T」、コード専用生成AI「Code Llama」投入するなど、生成AIに関する重要論文5本を解説します。
ヤマハの「VOCALOID β-STUDIO」を実際に使ってみました。まだ半日程度ですが、いくつかわかったことがあります。
これまで作品を作ってきたボカロPは、ヤマハの新しいVOCALOID技術を無償で試すチャンス。「VOCALOID β-STUDIO」の参加受付が始まりました。
前回はモデルの1つであるCheckpointについていろいろお話した。今回はStable Diffusionが扱えるモデルの中で次によく使われるLoRAについてがお題となる。
今週の生成AI注目論文は、任意の人の音声を合成できるマイクロソフトのText-to-Speechモデルなど5本です。
ガートナーのハイプサイクル、日本ではWeb3、NFT、メタバースが「幻滅期」入りしました。
ガートナーのハイプサイクル。今年はすでに多くのITエンジニアに聞き馴染みのあるキーワードが比較的保守的といえる場所に並んでいます。
Googleは米国にて、iOSおよびAndroid用のGoogleアプリ内で、閲覧中のサイトにある長文を箇条書きに要約してくれる「SGE while browsing(ブラウジング中のSGE)」機能の初期テストを始めました。
1週間分の生成AI主要論文を紹介する連載。今回は、25体の自律AIが住む町、“ちらつき”を抑えた動画合成を生成するAIなど。
最近AnimateDiffというAI動画手法がすごいと各所で注目されています。
ロサンゼルスの一部地域では、昨年からロボット関連のスタートアップ企業数社によって、フードデリバリーロボットを使った食品配達がテストされています。
NVIDIAが生成AIに関わる人なら必ずお世話になっているHugging Faceと提携しました。そこで提供するのはTraining Cluster as a Serviceと呼ばれるものです。
マイクロソフトはOpenAIのAI言語モデルを統合したBing Chatを、まもなくサードパーティ製Webブラウザにも提供することを発表しました。
Checkpointとは!?
盗作をできるだけ避けて音楽生成するAI、複数のLLMが協力してソフトウェア開発を行うフレームワークなど、最新のAI論文5つを紹介します。
「第二回AIアートグランプリ」は第一回と同じ審査員構成ですが、今回は作品テーマが「明日」と決められています。
ラジオドラマの番組を自動生成できる大規模言語モデルなど、最新の生成AI関連の重要論文を5本、紹介します。
イーサネットの仕様を改善し、AIやハイパフォーマンスコンピューティング(HPC)のような高速かつ大規模なデータ処理に適した、より高速なイーサネットの実現を目指す団体「Ultra Ethernetコンソーシアム」が発足しました。
SDXL 1.0リリース!
OpenAIは7月26日、ChatGPTのAndroid版をリリースしました。現在、米国、インド、バングラデシュ、ブラジルでダウンロード可能となっており、来週以降さらに多くの国への展開を予定しているとのことです。
実際の撮影と呪文の関係は似てる!?
Transformerより学習速度が速く、低遅延で、メモリ効率にも優れ、同等性能以上の精度を示すという「Transformerの後継モデル」をマイクロソフトらが発表しました。
OpenAIが、Android版のChatGPTアプリを来週リリースするとツイートしました。iOS版は5月にリリースされ、当時Android版については「まもなく」とアナウンスしていましたが、感覚的にはわりと長い間が開いてのリリースとなります。