OpenAIのAI技術を胸に装着する小型デバイスで操作する「Ai Pin」が注目されています。スタートアップでありながら野心的なAIデバイスを投入したシリコンバレーのメーカーHumaneに、筆者は1年ほど前から注目していたのでした。
今回の生成AI論文紹介では、画像の生成、理解、対話といった分野での進歩がありました。
Netflixが、オンラインで開催中のイベントGeel Week 2023でSF映画『ターミネーター』の新作アニメシリーズを独占配信すると発表しました。
『地球外少年少女』
ソースネクストからスピンアウトしたポケトークは、新サービスの「ポケトーク for Business 同時通訳」のブラウザ版を発表しました。すでにサービスは開始されており、月額3300円/年額3万9600円で利用できます。for Businessのため、法人向けという位置づけではありますが、個人ユースにも対応。サブスクとしてはやや高めな印象はあるものの、払えないほどの金額ではない絶妙な価格設定になっています。
Windows関連の情報サイトWindows Centralが、独自に得た情報としてマイクロソフトがWindows 10にWindows 11と同じAiアシスタントのCopilotを提供すると伝えています。
前回、連載11回目はSD 1.5用のModelとLoRAを主にご紹介した。12回目の今回は予告どおり、次世代 Stable Diffusion として表現力が格段に向上した SDXL用のModelとLoRA、そして+αをご紹介したい。
AIの24時間ハッカソンの審査会を見てきたと思ったら、次の24時間耐久GPTハッカソンが開かれるという知らせが。
OpenAIは11月6日(米時間)、同社初となる開発者会議「DevDay」にて、生成AIの新モデル「GPT-4 Turbo」を発表しました。
イーロン・マスクが設立したAIベンチャーxAIが、新しいAIチャットボット「Grok」を発表しました。xAIの声明によればGrokはマスク氏が所有するSNS、「X」からのデータで強化され、他社のAIチャットボットに比べ最新の情報に関する質問にも回答できるとされています。
文章を生業とする人ならば避けて通れない「校正・校閲」作業。そのための新しいツールが朝日新聞社から登場したので、それを西田宗千佳さんが使ってみた。
その週の重要論文5本を解説する連載。今回は、OpenAIの文字起こし「Whisper」の高速化モデル「Distil-Whisper」、スマホで自分の声を別人の声に即時変換するモデル「LLVC」など。
イーロン・マスク氏が、7月に発表した人工知能開発企業xAIの初のAIモデルを11月4日に公開するとX(Twitter)で発表しました。
俳優のスカーレット・ヨハンソンが、AI画像生成アプリ『Lisa AI: 90s Yearbook & Avatar』の広告にAI生成した自身の肖像と声が使われていることに対して法的措置を講じ、取り下げさせました。
ビートルズの「新曲」が11月3日に公開されます。その制作ドキュメンタリーが本日公開され、その曲の一部を聴くことができましたので、そこでどんなことが行われていたのかをまとめ
今回は3Dモデルで大きな躍進がありました。画像1枚から3Dモデルを高品質に生成する拡散モデル「Zero123++」をはじめとする、生成AI最新論文の概要5つをお届けします。
音楽ストリーミングアプリYouTube Musicは、生成AIによりプレイリスト用のオリジナル画像を作るテスト機能の提供を開始しました。
ここのところ、生成AI画像環境構築やアプリの使い方などで3回、顔LoRA制作…と少し重いネタが続いたので、今回は軽めの気になるModelやLoRAを作例と共にご紹介したい。
人気連載「生成AIグラビアをグラビアカメラマンが作るとどうなる?」の著者である西川和久さんを講師に迎えた、生成AIグラビアワークショップを開始します。
生成AIの重要論文5つを紹介する連載。今回はWeb上のサービスを言語指示でフル活用できるChrome拡張機能を用いたAI「OpenAgents」、偉人を完コピするAI「Character-LLM」など。
今回のAppleシリコンにネイティブ対応したMac版のリリースは、Linux版に続くもの。Windows版のリリース時期は未定です。
Modelに無い顔や彼女の顔を出したい!
Pythonのスーパーセット言語として注目されているMojoは現在Linux版のみ。次はWindows版ではなくMac版になりそうだ。
アップルらが開発したMultimodal Large Language Modelの「Ferret」など、5本の生成AI関連論文を紹介します。
Googleは8月30日より、Google Search labs登録ユーザーを対象に「生成AIによる検索体験(SGE)」の提供を開始していますが、10月12日にこの機能を拡張し、SGEにオプトインしたユーザーは、通常のGoogle検索バーからAIによる画像生成を行うことが可能になりました。
今年も、Adobeの年次イベント「Adobe MAX 2023」の取材で米ロサンゼルスに来ている。Adobeのイベントでは多数の新技術が発表になるが、やはり「華」でありハイライトは、開発途上の技術を先出しする「Sneaks」だ。
■画像生成は出来たけど…何かもう一捻りしたい!
生成AIの重要論文を解説する連載。今回は、大規模言語モデルでどんなに長い文章でも破綻しない手法、キャラクターの性格や話し方を模倣するAIなど紹介します。
Googleは、日本時間10月4日夜に開催されたMade By GoogleイベントでAndroidとiOS向けの「Assistant with Bard」を発表しました。
GoogleはクラウドサービスGoogle Cloudの最新技術と導入事例を発表するイベント Google Cloud Next Tokyo を4年ぶりに開催します。
米国の女優・監督兼プロデューサー、ゼルダ・ウィリアムズ氏は、すでに亡くなった人の遺志を考慮することなくAIで再現したり、置き換えたりする試みに対して「個人的に不快だ」と述べています。
生成AIの重要論文5本を解説する連載。今回は、3Dモデルを高速生成する「DreamGaussian」、ネット記事量産AI「InternLM-XComposer」などです。
アップルが完全自動運転のEV(電気自動車)関連技術を開発していることは、公然の事実です。
マイクロソフトは2009年からGoogleのライバルとしてウェブ検索サービス「Bing」を展開してきました。今年2月にはOpenAIの大規模言語モデルを統合したBing AIを発表して、ユーザー数を増やしています。
Stable Diffusionを使う新たなインターフェース、Fooocusをご紹介したい。インストールはbat一発、起動/アップデートもbat一発、Modelも初期起動時に自動的にダウンロードと非常にシンプル。そしてなにより、出てくる絵が驚異的という優れたインターフェースなのだ。
「Meta Connect」という開発者向けイベントに参加した。なぜQuestシリーズに力を入れるのか、なぜAI技術に投資を行うのか。その答えの先には、常にSNSの存在がある。Metaにとっての生成AIとはコミュニケーションを円滑に行うための道具なのだ。
生成AIで学習して生成した顔写真を元に、3Dデジタルヒューマンを作成し、それを等身大のアニメーションにしてみました。
Microsoftは9月26日(現地時間)、Windows 11 22H2向けに非セキュリティプレビュー更新プログラム(KB5030310)の配信を開始しました。
全米脚本家組合(WGA)は、生成AI使用の規制や動画ストリーミングからの報酬などに関し、大手スタジオとの間で約5か月にわたるストライキを終了させるための暫定的な合意に達したと発表しました。
OpenAIは9月25日、ChatGPTのバージョンアップを発表しました。今後2週間でロールアウトし、Plusプランのユーザーは、iOSとAndroidアプリではChatGPTと音声で会話することが可能になり、画像を含んだ会話ができるようになります。
生成AIを利用してバーチャルヒューマンを制作してみました。
■生成AIグラビアを実際作るには!?