この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第89回)では、リアルタイムで動作する対話可能なAI搭載実写3Dアバターを生成できる技術「TaoAvatar」、テキストや映像などを認識しながら同時にテキストや音声応答できるAIモデル「Qwen2.5-Omni」を取り上げます。
いきなり登場したReve Image。当たると「え?これデジイチで撮った写真!?」的な画像が生成され、明らかにFLUX.1 [dev]を超えている。
今回は、AGI(汎用人工知能)の進歩を測定するために設計された新しいベンチマークテスト「ARC-AGI-2」が登場し、最先端のAIモデルが挑戦した、その結果報告を取り上げます。
Xでローカル生成AIのためのマシンはこんなのがいいんじゃないか?と投稿してみたのですが、予想外に反響があったので、ChatGPT deep researchを使ってまとめてみました。
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第88回)では、高解像度な3Dメッシュを生成できるAIモデル「DeepMesh」、スマホカメラから実世界の3D空間を理解する大規模言語モデル「SpatialLM-Llama-1B」を取り上げます。
OpenAIがまたYouTubeライブで発表をしました。今回のモデルはChatGPT 4oと、いささか古いのですが、その画像生成についての進展がテーマです。
2016年のGoogle I/Oで、初のスマートスピーカー「Google Home」と共に発表された「Googleアシスタント」ですが、そろそろお別れの時が来たようです。
GDC 2025で「Roblox(ロブロックス)」がAIを使った新しい機能を披露していました。
生成AIモデルが検索で引用する情報が誤ったものが多いことを指摘した米コロンビア大学のTow Center for Digital Journalismによる2025年3月発表の研究を取り上げます。
GoogleがPixelスマートフォンの最新モデル、Pixel 9シリーズの廉価版 Pixel 9a を米国で発表しました。
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第87回)では、声の高さや話す速度も調整可能な高度なテキスト読み上げシステム「Spark-TTS」や、3DビデオゲームをAIがプレイできるようにするフレームワーク「PORTAL」を取り上げます。
文部科学省のGIGAスクール構想は、1人1台の端末を導入し、教育のデジタル化と子供たちのICT活用を目指しています。2021年時点で小中学校のほぼ100%で導入が完了し、現在も活用が進んでいます。高校ではBYOD(Bring Your Own Device)が増加しており、保護者は端末選びに悩むことが多いです。本稿では高校生活の学習を支える優れた機能性と使いやすさ、コストパフォーマンスの良さが魅力の「Chromebook」を紹介します。
今回は、動画サービスから画像も生成可能へ、そしてLLMから画像生成/編集と、同じ生成AI画像でもちょっと面白いのをご紹介します。Google AI Studio + Gemini 2.0 Flash (Image Generation) Experimental
1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。今回は、人工知能を促進することを目的とした国際的な学術団体「AAAI」が2025年3月に公開したレポート「AAAI 2025 PRESIDENTIAL PANEL ON THE Published March 2025 Future of AI Research」に注目します。
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第86回)では、大規模言語モデル「QwQ-32B」を改良した「START」や、PDFからのテキスト抽出が安く高品質にできるツール「olmOCR」などを取り上げます。
ポケモンGOやモンハンNow、ピクミンブルームの運営元ナイアンティックが、主要ゲーム3タイトルと周辺アプリの売却を正式に発表しました。
テクノエッジ編集部では、生成AIグラビア実践ワークショップ第3期第5回を3月19日に開催します。今回はRTX 5090 GPUの生成AIへの活用について、特に解説します。
1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。今回は、3月5日にリリースされ中国で話題になっているAIエージェント「Manus」に注目します。
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第85回)では、アリババの新しいオープンソース動画生成AI「Wan2.1」や、PC画面操作やロボット操作を実行できるマルチモーダルAIエージェント「Magma」を取り上げます。
狭い領域のファインチューニング(微調整)が広範囲の誤整合を引き起こす現象が発見された研究論文「Emergent Misalignment: Narrow finetuning can produce broadly misaligned LLMs」に注目します。
筆者はZwiftという仮想世界に入り浸っています。Zwiftというのは、自転車(とランナー)が、共通の3D世界の中で走る有料サービス。月額2400円と高額ですが、友人やまったく知らない人たちと同じ道を走れる楽しさは格別なものです。
FLUX.1 [dev]のテイストに飽きた!?
アリババグループのクラウドプロバイダー Alibaba Cloud が、4月25日(金)~27日(日)開催のゲーム開発ハッカソン Tokyo Game Jam Spring 2025 に向けて参加者を募集しています。
米国のロボット開発ベンチャーFigureは、今年中に家庭環境でヒューマノイドロボット「Figure 02」のアルファテストを開始することを明らかにしました。
2月26日、米Amazonは音声AIアシスタントのAlexaを生成AIで大幅に強化した「Alexa+」を発表しました。Prime会員は無料で使用できます。
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第84回)では、リアルタイムの音声対話を実現するオープンソースAIモデル「Step-Audio」、実世界の報酬基準でフリーランスのAIエンジニアリング能力を評価するOpenAI開発ベンチマーク「SWE-Lancer」を取り上げます。
中国のロボット開発ベンチャー企業Zhongqing Robotics(EngineAI)は、同社製ヒューマノイド「PM01」が前方宙返りを成功させる様子を収めた動画を公開しました。
AIハッカソンが日本5箇所を巡業開催する。
英国で、総勢1000人の音楽アーティストが集い「無音のアルバム」を制作、公開しました。
ゼロからゲノムを生成できる、9.3兆個塩基対のDNA配列データを学習した40Bパラメータを持つ大規模言語モデル(LLM)を提案した論文「Genome modeling and design across all domains of life with Evo 2」に注目します。
イーロン・マスク、何を考えてるんだ……。倫理観が最も薄いのではないかと評判のLLM(大規模言語モデル)「Grok 3」ですが、セクシー&ロマンティックなコンテンツをリリースしてしまいました。Voice Conversation Mode(音声会話モード)です。
ポーランドのロボット開発ベンチャーClone Roboticsは、世界初をうたう二足歩行筋骨格アンドロイド「Protoclone V1」の動画を公開しました。
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第83回)では、大規模言語モデル(LLM)を画像操作できるAIエージェントに変換する「OmniParser V2」や、ByteDanceの画像や動画を生成する新しいAI「Goku」を取り上げます。
Topaz Video AIの新機能「Project Starlight」は、古いビデオを高品質に修復する優れたDiffusionモデルを採用。ユーザーは無料で試せ、ディテールが鮮明に再現される。
それにしても、ほぼ毎日AI関連のニュースが届きますね。私は普段、海外(主に米国)のIT系ニュースの速報をお届けする仕事をしているんですが、最近ではAI関連の速報を書かない日はほとんどありません。
Suno、Udio、Riffusion、そして最近ではYuEというオープンソースソフトも登場してきたAI作曲ソフトですが、完成形を作るのには向いていても、部分的な修正は苦手です。その状況がいい方に変わってきました。
睡眠や運動、心拍など各種バイタルデータを24時間計測するスマートリング、RingConn (第2世代モデル)が国内向けクラウドファンディングを開始しました。
Google Whisk
人気連載「生成AIグラビアをグラビアカメラマンが作るとどうなる?」の著者である西川和久さんを講師に迎えた、生成AIグラビアワークショップの第3期第4回を2月19日に開催いたします。
コーディングで良好な成果を示しているOpenAIの「o3」が国際情報オリンピック(IOI)で金メダルを達成した研究報告「Competitive Programming with Large Reasoning Models」に注目します。
統合型チャットAIサービスであるPerplexityが新サービスをリリースしました。「Deep Research」オプションの追加です。
超光速。FTL(Faster Than Light)とも呼ばれることがある、SFファンならおなじみの移動手段です。それに近い技術をどこかが開発したとか実現不可能だと分かったとか、断片的な報道がたまにされています。