
ローカルマシンだけで生成AIはどこまでいける? MacBook Pro(M4 Max、128GBメモリ)を手に入れたローカルAI男子の遠吠え(2024年ベストバイ)
128GB M4 Max MacBook Pro、予約しただけで記事を書いた私ですが、ようやく届いたので、いろいろとやりたかったことを試しています。

Google Glassから苦節12年。ついに「真の」スマートグラス誕生? Project AstraとAndroid XRで実現する未来(Google Tales)
Googleの共同創業者、サーゲイ・ブリンさんがGoogle I/O 2012で華々しく「Google Glass」を披露してから12年。Googleは2024年12月11日に「Project Astra」を、12日には「Android XR」を発表しました。

AIは無知をどこまで認識できるか? 人類が回答不可能な質問をGPTやClaude、Geminiなどに大量にぶつけてみた(生成AIクローズアップ)
AIたちが「答えが分からない」と自身の無知を認識できるかを検証した論文「The Impossible Test: A 2024 Unsolvable Dataset and A Chance for an AGI Quiz」を取り上げます。

忘年会でオーバー60の人たちにAIボイチェンとAIミュージックビデオを披露した結果(CloseBox)
先週の土曜日は、大学時代の軽音サークルの忘年会ライブがありました。そこで筆者も演奏したのですが、今年はAIリアルタイムボイチェンと、AIを使ったミュージックビデオを披露しました。

長編ドキュメンタリー作品「AIで愛になる~超愛妻家・松尾公也とテクノロジーの未来」が公開されます(CloseBox)
自分の半生を描いたドキュメンタリー作品がYouTubeで公開されます。

Googleが自律的プログラミングAIエージェント「Jules」を発表。Gemini 2.0で実装計画を作成、コード生成・変更・バグフィクスなど実行
Googleは、人間がタスクを与えると自律的に実装計画を立ててコードの生成や変更、バグフィクスなどを実行してくれるAIエージェント「Jules」を発表しました。

ChatGPTでサンタさんとの音声会話ができるように。iPhoneだけでGoogle Stream Realtime対抗のビデオ・画面共有会話もやってみた(CloseBox)
OpenAIが12日間、新機能を発表する「12 Days of OpenAI」、6日目はChatGPTのAdvanced Voice Mode(高度な音声)の新機能について。

iPhoneだけでAI画像生成できる、Apple IntelligenceのImage Playgroundが使えるiOS 18.2で、ChatGPTとSiriの統合を試してみた(CloseBox)
Apple Intelligenceはまだ日本語では使えませんが、英語モードにすれば利用可能です。本日アップデートされたiOS 18.2ではChatGPTとの統合に加え、待望のAI画像生成機能「Image Playground」が追加されました。その機能を試してみます。

Google怒涛の新作AI発表。1位獲得の言語AI「Gemini-Exp-1206」、画像1枚からプレイ可能な3Dゲーム生成AI「Genie 2」、動画生成AI「Veo」、高性能天気予報AI「GenCast」など生成AI技術5つを解説(生成AIウィークリー)
OpenAIは、ChatGPTの新しい有料プラン「ChatGPT Pro」を発表しました。価格は月額200ドルで、最高レベルの「OpenAI o1」を含むすべてのモデルを無制限で使用することができます。

「登場即ライバル動画生成AI死亡」ではなかった。使ってわかったSoraの品質と限界(CloseBox)
人気のため一時はアカウント作成ができない状態だったSoraですが、ようやくアカウントを作成し、ログインできたので試してみました。

AIで「量子もつれ」の新たな生成方法を発見。量子インターネット構築が容易になる可能性(生成AIクローズアップ)
中国の南京大学やドイツのMax Planck Institute for the Science of Lightに所属する研究者らが、AIシステムを用いて量子もつれの新しい生成方法を発見した論文「Entangling Independent Particles by Path Identity」を解説します。

OpenAIアドベントカレンダーこと「12 Days of OpenAI」、スタート。Day 1はChatGPT Pro(月額200ドル)とo1完全版(CloseBox)
OpenAIアドベントカレンダーこと「12 Days of OpenAI」、が始まりました。初日はChatGPT Pro(月額200ドル)とo1完全版を発表しました。

OpenAI、今夜から12回の(ウィークデー)ライブ発表を予告。やっとSoraが使えるようになるの?(CloseBox)
毎年この時期に大きな発表をするのが慣例となっているOpenAIですが、今年は1回では収まらず、12日連続(ただしウィークデーのみ)のライブストリーミングで行うことをXへのポストで予告しています。

NVIDIAの最新生成AI。高解像度画像をFLUX.1の100倍以上高速に作り出すAI「Sana」、テキストから高品質な3Dアセットを生成するAI「Edify 3D」など生成AI技術5つを解説(生成AIウィークリー)
NVIDIAが主導して開発した、高解像度の画像を高速に生成するモデル「Sana」と、テキストから3Dアセットを生成するAI「Edify 3D」などを紹介します

夢の中へ行ってみたいと思ったのでAIで再現してみた(CloseBox)
今朝見た夢をAIで再現しようと思います。

2024年最大の散財、新しい俺の相棒「M4 Max MacBook Pro」を紹介するぜ(CloseBox)
猫も杓子も128GB M4 Max MacBook Proなのはどういうことでしょうか。

数十億パラメータの巨大AI、“たった1つのパラメータ”を削除するだけで完全崩壊。Appleなどが研究報告(生成AIクローズアップ)
大規模言語モデル(LLM)の数十億のパラメータの中でたった1つのパラメータを削除するだけで、モデルのテキスト生成能力が完全に崩壊することを発見した論文「The Super Weight in Large Language Models」について解説します。

AIオリジナル曲のリップシンクミュージックビデオを爆速で作る方法(CloseBox)
「最も簡単にオリジナル曲のリップシンクミュージックビデオを作る方法」について解説します。まあ、自分で弾き語りするのが一番簡単なんですが、それは置いといて(笑)

自動運転車が緊急車両に衝突するのは「デジタルてんかん発作」のせい?研究者が報告
イスラエルのネゲヴ・ベン=グリオン大学(BGU)と富士通の研究チームは、一部の自動運転 / 先進運転支援システム搭載車が停止中の緊急車両に衝突する事故は、システムが「デジタルてんかん発作」を起こすのが原因かもしれないとする研究結果を報告しました。

Claude 3.5 Computer Useのゲーム操作はどのレベル? 映像内の混雑シーンでも高速に動く物体を追跡できる「SAMURAI」など生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第73回)では、生成AIでコンピュータを操作する「Claude 3.5 Computer Use」の性能調査や、動画内の動く物体を追跡し分離するAI「SAMURAI」を取り上げます。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第37回:人肌をよりリアルにするDetail Daemon(西川和久)
Detail Daemonとは?またその効果は?

AI動画生成のLuma Dream MachineがUI刷新してキャラバリなど大幅機能追加したので試してみた(CloseBox)
Luma AIは動画生成AIサービスのDream Machineに大きな改変を施しました。

さくらインターネット、生成AIプラットフォームサービスの開発に着手。NEC製LLM「ことみ」も提供
さくらインターネットは、生成AIのプラットフォームサービスの開発に着手したことを発表しました。

“実在する人間”の考えをクローンした自律AIを1000体以上生成。高い精度で世論調査や社会の反応予測など活用へ(生成AIクローズアップ)
実在する人の性格や考えを忠実にコピーしたAIエージェント(自律AI)を1000体以上生成した論文「Generative Agent Simulations of 1,000 People」を取り上げます。

新世代AI読み上げソフトAivisSpeech、Style-Bert-VITS2とHeyGenアバターでレシピ動画を超簡単に料理してみた(CloseBox)
AivisSpeechとは、日本で開発されたAI音声合成ソフトで、いくつかのプリセットボイスが使える推論用アプリがMac、Windows向けに提供されており、すぐに試すことができます。

Excel上でPythonコードが生成、実行可能に。「Copilot in Excel with Python」正式版に(ただし米国版のみ)
マイクロソフトは米イリノイ州シカゴで開催中のイベント「Microsoft Ignite 2024」で、Excel上でCopilotがPythonコードを生成、実行してくれる「Copilot in Excel with Python」が米国版(EN-US)Windows環境において正式版になったことを明らかにしました。

大きくなったハイエンド縦折りフォルダブル「razr 50 ultra」ハンズオン。懐かしのホットピンクも(石野純也)
モトローラ・モビリティ・ジャパンは、razrシリーズの最上位モデルにあたる「razr 50 ultra」を日本市場に導入することを発表しました。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第36回:Stable Diffusion 3.5 Large TurboとMedium(西川和久)
4 stepsで生成可能なDiffusion 3.5 Large Turboの実力は!?

自律AIたちが議論する環境「TinyTroupe」をMicrosoftが開発、GPT-4o級のコーディングができるオープンソースAI「Qwen2.5-Coder」など生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第72回)では、GPT-4oのコーディング能力に匹敵するオープンソースなコード生成AI「Qwen2.5-Coder」や、AI生成の画像の一部のみに電子透かしを入れることができる「WAM」を取り上げます。

これはもう人間? Suno v4の音質向上は本物か、過去バージョンもリマスターしてみた(CloseBox)
テキストの指示で楽曲を完成することができるAI作曲サービス「Suno」が、v4にメジャーバージョンアップされました。最大のポイントは音質向上です。

この画質をローカルマシンで? オープンソース動画生成AI「Pyramid Flow」は商用サービスにどのくらい迫っているのか確かめてみた(CloseBox)
動画生成AIはRunwayを筆頭に、中国系サービスも参入し、激しい開発競争を繰り広げていますが、オープンソースソフトもかなりのレベルに到達しています。

「生成AI vs. 著名な詩人」どっちの詩が好き? シェイクスピアやディキンソンなどとAI詩を比較(生成AIクローズアップ)
AIが生成した詩と詩人による作品とが区別できるのか、またどちらが好まれるかを調査した論文「AI-generated poetry is indistinguishable from human-written poetry and is rated more favorably」に注目します。

著名人の声でテキスト読み上げできるElevenReaderアプリで、「オズの魔法使い」主演に原作小説を日本語で読み上げてもらったら(CloseBox)
Elevenlabsが、書籍やオンライン記事などを、有名人を含むバラエティに富んだ声で読み上げる無料サービスを提供しています。最近、ここに伝説的なサイケデリックロックバンドであるグレイトフル・デッドのリーダーであったジェリー・ガルシアが加わりました。ミュージシャンの登場は初めてということで、注目を集めています。

PDFを生成AIの学習用データに変えるIBM製AI「Docling」、1枚の画像から動く3Dシーン生成する「DimensionX」など生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第71回)では、1枚の画像から3D/4Dシーンを生成するAIモデル「DimensionX」や、テンセント開発の巨大オープンソース大規模言語モデル「Hunyuan-Large」を取り上げます。

祝PS5 Pro発売。憧れのマシンの性能を『OS代込みで12万円のゲーミング自作PC』でどの程度まで行けるのか、作って試してみる。オンラインイベントを11月16日開催
テクノロジージャーナリストの西川善司さんを講師に、すでに組み上げ済みのPS5 Pro同予算自作ゲーミングPCの実演と解説をを行います。

“生成AI活用”の上位10%は生産性が2倍近く向上するが「下位3分の1は効果なし」の理由。研究者1000人以上でMITが検証(生成AIクローズアップ)
生成AIが科学的発見とイノベーションにどのような影響を与えるのかについて、研究者たちに生成AIツールを使わせて、その効果を検証した論文「Artificial Intelligence, Scientific Discovery, and Product Innovation」に注目します。

ゲームエンジン不要。プレイ操作に応じてAIがリアルタイム生成するオープンワールドゲーム「Oasis」、Minecraftに500体の自律AIによる文明構築など生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第70回)では、劣化した写真を修復するAIモデル「DreamClear」や、新しいText-to-Speechモデル「MaskGCT」を取り上げます。

楽天モバイルのRakuten LinkにチャットAIが登場。生成AIが無料で文章作成や要約をサポート(石野純也)
楽天モバイルは、10月31日に「Rakuten Link」に生成AIを導入し、無料で文章作成や要約を提供します。AIは日常的に質問可能で、今後のサービス拡充が期待されます。

ChatGPT searchはGoogle検索の脅威となるか? 試してわかったこと(Google Tales)
OpenAIがSearchGPTの提供を開始したことが、すわGoogle検索キラーの本命か、とかなり話題になっておりました。Googleも、かなり危機感を持っていると思います。

この世に“存在しない”DNA配列をAIが創造。生成した人工DNA配列をマウスや魚に組み込む(生成AIクローズアップ)
今回は、自然界に存在しないDNA配列を生成できるAIシステムを提案した論文「Machine-guided design of cell-type-targeting cis-regulatory elements」に注目します。

HeyGenが進化し、20枚の写真から表現力あるAIアバターを作成。OpenAIの多言語ボイスクローン使用か(CloseBox)
HeyGenが、20枚以上(10枚程度でも可能)の本人写真・画像があれば、そのアバターを作って、リアルなリップシンクができるようになったのです。さらに、ボイスクローンも。

GitHubで最も使われている言語、PythonがJavaScriptを抜き1位に。生成AI関連プロジェクト急増が要因
GitHubは、この1年のGitHubにおけるGitHubの利用動向やオープンソースの動向などをまとめた年次レポート「Octoverse 2024」を発表しました。