山下裕毅(Seamless)の記事一覧

山下裕毅(Seamless)

2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。

8TBの“著作権フリー”含むAI用大規模データセット「Common Pile v0.1」、長さ上限なしで動画生成できる音声駆動AI「SkyReels-Audio」など生成AI技術6つを解説(生成AIウィークリー) 画像
テクノロジー

8TBの“著作権フリー”含むAI用大規模データセット「Common Pile v0.1」、長さ上限なしで動画生成できる音声駆動AI「SkyReels-Audio」など生成AI技術6つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第99回)では、人間のようにPC画面を見て操作するMicrosoft開発のAIエージェント「GUI-Actor」や、理論上無限の長さのリップシンク映像を生成できる動画AI「SkyReels-Audとio」を取り上げます。

「死海文書」をAIで書体分析したら、書かれた時期が従来説より古いと判明(生成AIクローズアップ) 画像
テクノロジー

「死海文書」をAIで書体分析したら、書かれた時期が従来説より古いと判明(生成AIクローズアップ)

今回は、AIを用いて死海文書の筆跡を分析した論文「Dating ancient manuscripts using radiocarbon and AI-based writing style analysis」を取り上げます。

AI格差は今、どうなっているのか? 収入や地位、教育などの違いで生成AIの活用方法、プロンプトがどう違うのか 1000人を対象に「AIギャップ」を調査(生成AIクローズアップ) 画像
テクノロジー

AI格差は今、どうなっているのか? 収入や地位、教育などの違いで生成AIの活用方法、プロンプトがどう違うのか 1000人を対象に「AIギャップ」を調査(生成AIクローズアップ)

今回は、社会経済的地位の違いでAIの利用方法がどう異なるのかの「AIギャップ」を調査した研究「The AI Gap: How Socioeconomic Status Affects Language Technology Interactions」を取り上げます。

ByteDanceが怒涛の新作AI。テキストと画像の両方に秀でた生成AI「MMaDA」、PDFや画像内の文章を抽出するAI「Dolphin」など生成AI技術5つを解説(生成AIウィークリー) 画像
テクノロジー

ByteDanceが怒涛の新作AI。テキストと画像の両方に秀でた生成AI「MMaDA」、PDFや画像内の文章を抽出するAI「Dolphin」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第97回)では、Tiktokの開発元として有名な中国企業「ByteDance」が発表した4つのAI技術を取り上げます。

「脳への電極埋め込み」なしで脳活動から高精度で考えを文字起こしするAI技術、オックスフォード大が発表(生成AIクローズアップ) 画像
テクノロジー

「脳への電極埋め込み」なしで脳活動から高精度で考えを文字起こしするAI技術、オックスフォード大が発表(生成AIクローズアップ)

1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。今回は、脳に電極を埋め込まないで脳活動から直接文章を文字に起こす非侵襲AI技術を提案した、オックスフォード大学の研究者らによる論文「Unlocking Non-Invasive Brain-to-Text」を取り上げます。

コード全体を改良し続けるGoogleの自己進化型AI「AlphaEvolve」、写真内の照明を点灯させるGoogle開発AI「LightLab」など生成AI技術5つを解説(生成AIウィークリー) 画像
テクノロジー

コード全体を改良し続けるGoogleの自己進化型AI「AlphaEvolve」、写真内の照明を点灯させるGoogle開発AI「LightLab」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第96回)では、参照音声だけで音声合成を生成できるTTSモデル「MiniMax-Speech」、自らアルゴリズムを発見して進化させ続けるAI「AlphaEvolve」を取り上げます。

国会議員の過去発言をAIで分析し、政治的立場をまとめたサイト「KOKKAI DOC」をトロント大が発表(生成AIクローズアップ) 画像
テクノロジー

国会議員の過去発言をAIで分析し、政治的立場をまとめたサイト「KOKKAI DOC」をトロント大が発表(生成AIクローズアップ)

今回は、大規模言語モデル(LLM)を活用して日本の国会議員のこれまでの発言を分析して政治的立場をまとめた研究「KOKKAI DOC: An LLM-driven framework for scaling parliamentary representatives」を取り上げます。

検索しないAI検索エンジン「ZeroSearch」、人間作成データ不要のセルフプレイAI「Absolute Zero」など生成AI技術5つを解説(生成AIウィークリー) 画像
テクノロジー

検索しないAI検索エンジン「ZeroSearch」、人間作成データ不要のセルフプレイAI「Absolute Zero」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第95回)では、“検索しない”AI検索エンジン「ZeroSearch」や、AI自身が学習効率の良いタスクを生成し自分で解くことで学習する外部データ不要のAIシステム「Absolute Zero」を取り上げます。

AIの「幻覚」はかつてないほど悪化している。幻覚率ランキング1位のAIモデルは?(生成AIクローズアップ) 画像
テクノロジー

AIの「幻覚」はかつてないほど悪化している。幻覚率ランキング1位のAIモデルは?(生成AIクローズアップ)

今回は、チャットボットAIの精度が日進月歩で向上している一方で悪化している「幻覚」(ハルシネーション)の現状についてを取り上げたいと思います。

AIに繰り返し自己議論させる→考えが深くなり精度が向上する「CoRT 」、1ビットLLMの進化版「BitNet v2」登場など生成AI技術5つを解説(生成AIウィークリー) 画像
テクノロジー

AIに繰り返し自己議論させる→考えが深くなり精度が向上する「CoRT 」、1ビットLLMの進化版「BitNet v2」登場など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第94回)では、1ビットLLMの進化版「BitNet v2」と、AIに何度も自己議論させることで精度が向上していく手法「CoRT 」を取り上げます。

鵜呑みにできない、AIモデルの世界評価ランキング「Chatbot Arena」の闇と幻想 不公平を解き明かす(生成AIクローズアップ) 画像
テクノロジー

鵜呑みにできない、AIモデルの世界評価ランキング「Chatbot Arena」の闇と幻想 不公平を解き明かす(生成AIクローズアップ)

今回は、現在AIモデル評価の業界標準とされているランキング形式(リーダーボード)のAIベンチマーク「Chatbot Arena」における問題を明らかにした研究「The Leaderboard Illusion」を取り上げます。

GitHubリポジトリを読み取り、ドキュメントを自動生成するAIツール「DeepWiki」がログイン不要、無料で使える(生成AIクローズアップ) 画像
テクノロジー

GitHubリポジトリを読み取り、ドキュメントを自動生成するAIツール「DeepWiki」がログイン不要、無料で使える(生成AIクローズアップ)

1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。今回は、GitHub上のリポジトリを自動的に解析し、ドキュメントを生成してくれるオープンソースAIツール「DeepWiki」を取り上げます。

“1分の生成映像でも破綻しにくくする”動画AI向け強化技術「FramePack」の原理、AIと人間の声を区別できるか600人以上で実験など生成AI技術5つを解説(生成AIウィークリー) 画像
テクノロジー

“1分の生成映像でも破綻しにくくする”動画AI向け強化技術「FramePack」の原理、AIと人間の声を区別できるか600人以上で実験など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第92回)では、ByteDanceが発表した2つのモデル、動画生成AI「Seaweed-7B」とGPT-4o超えという画像生成AI「Seedream 3.0」を取り上げます。

AIに「逆転裁判」をプレイさせ、推論能力が一番高かったのはどのLLM?(生成AIクローズアップ) 画像
テクノロジー

AIに「逆転裁判」をプレイさせ、推論能力が一番高かったのはどのLLM?(生成AIクローズアップ)

1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。今回は、AIモデルに「逆転裁判」をプレイさせて推論能力を調査した内容を取り上げます。

複雑なキャラの高品質なSVG画像を生成するAI「OmniSVG」、異なる写真同士を合体生成する「UNO」など生成AI技術5つを解説(生成AIウィークリー) 画像
テクノロジー

複雑なキャラの高品質なSVG画像を生成するAI「OmniSVG」、異なる写真同士を合体生成する「UNO」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第91回)では、複数の写真に写る被写体を1枚の写真に統合させる画像生成AI「UNO」や、1枚の写真から音声に応じた話す人物映像を作成するトーキングヘッド生成AI「FantasyTalking」を取り上げます。

AIは人間に不信感を抱いてる? AIが人間の本質をどのように捉えているかを調査した研究(生成AIクローズアップ) 画像
テクノロジー

AIは人間に不信感を抱いてる? AIが人間の本質をどのように捉えているかを調査した研究(生成AIクローズアップ)

今回は、大規模言語モデル(LLM)が人間の本質をどのように捉えているかを調査した論文「Measurement of LLM’s Philosophies of Human Nature」を取り上げます。

アニメ主人公になりきり好きなシーンを生成しながら無限に遊べるゲームAI「AnimeGamer」、写真内の人物を映像化できる「DreamActor-M1」など生成AI技術5つを解説(生成AIウィークリー) 画像
テクノロジー

アニメ主人公になりきり好きなシーンを生成しながら無限に遊べるゲームAI「AnimeGamer」、写真内の人物を映像化できる「DreamActor-M1」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第90回)では、写真内の人物をテキスト指示に応じたアニメーション映像を生成する動画AI「DreamActor-M1」や、テキストから映画級の人物映像を生成できる動画AI「MoCha」をご紹介します。

完全無料のヴァイブコーディングAI「DeepSite」誕生。アイデアを文章入力→ブラウザ上でゲームが数分で生成、プレイ可能(生成AIクローズアップ) 画像
テクノロジー

完全無料のヴァイブコーディングAI「DeepSite」誕生。アイデアを文章入力→ブラウザ上でゲームが数分で生成、プレイ可能(生成AIクローズアップ)

今回は、アイデアを自然言語で入力するだけでブラウザ上でゲームやWebサイトを生成できる完全無料でオープンソースなヴァイブコーディングAI「DeepSite」を取り上げます。

自律AIらが書いた論文を利用して研究を繰り返し続ける「AgentRxiv」、リアルタイム動作する対話可能な実写3DアバターAI「TaoAvatar」など生成AI技術5つを解説(生成AIウィークリー) 画像
テクノロジー

自律AIらが書いた論文を利用して研究を繰り返し続ける「AgentRxiv」、リアルタイム動作する対話可能な実写3DアバターAI「TaoAvatar」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第89回)では、リアルタイムで動作する対話可能なAI搭載実写3Dアバターを生成できる技術「TaoAvatar」、テキストや映像などを認識しながら同時にテキストや音声応答できるAIモデル「Qwen2.5-Omni」を取り上げます。

主要AIモデルはどれも“歯が立たない”、新しい「人間には簡単だがAIには難しいAGI問題」登場(生成AIクローズアップ) 画像
テクノロジー

主要AIモデルはどれも“歯が立たない”、新しい「人間には簡単だがAIには難しいAGI問題」登場(生成AIクローズアップ)

今回は、AGI(汎用人工知能)の進歩を測定するために設計された新しいベンチマークテスト「ARC-AGI-2」が登場し、最先端のAIモデルが挑戦した、その結果報告を取り上げます。

スマホカメラから実世界の3D空間を理解するLLM「SpatialLM」、静止画像を3Dビデオに変換する「Stable Virtual Camera」など生成AI技術5つを解説(生成AIウィークリー) 画像
テクノロジー

スマホカメラから実世界の3D空間を理解するLLM「SpatialLM」、静止画像を3Dビデオに変換する「Stable Virtual Camera」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第88回)では、高解像度な3Dメッシュを生成できるAIモデル「DeepMesh」、スマホカメラから実世界の3D空間を理解する大規模言語モデル「SpatialLM-Llama-1B」を取り上げます。

生成AIの検索エンジンは60%以上も間違った情報を引用。有料版は無料版より自信を持って間違えやすい(生成AIクローズアップ) 画像
テクノロジー

生成AIの検索エンジンは60%以上も間違った情報を引用。有料版は無料版より自信を持って間違えやすい(生成AIクローズアップ)

生成AIモデルが検索で引用する情報が誤ったものが多いことを指摘した米コロンビア大学のTow Center for Digital Journalismによる2025年3月発表の研究を取り上げます。

動画内の人物を好きなキャラに変更できる動画AI「VACE」、3DビデオゲームをAIにプレイさせる「PORTAL」など生成AI技術5つを解説(生成AIウィークリー) 画像
テクノロジー

動画内の人物を好きなキャラに変更できる動画AI「VACE」、3DビデオゲームをAIにプレイさせる「PORTAL」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第87回)では、声の高さや話す速度も調整可能な高度なテキスト読み上げシステム「Spark-TTS」や、3DビデオゲームをAIがプレイできるようにするフレームワーク「PORTAL」を取り上げます。

AI研究者の76%が「現モデルを大きくしてもAGIを実現できない」。AAAIがAIの現状と未来についてレポートを発表(生成AIクローズアップ) 画像
テクノロジー

AI研究者の76%が「現モデルを大きくしてもAGIを実現できない」。AAAIがAIの現状と未来についてレポートを発表(生成AIクローズアップ)

1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。今回は、人工知能を促進することを目的とした国際的な学術団体「AAAI」が2025年3月に公開したレポート「AAAI 2025 PRESIDENTIAL PANEL ON THE Published March 2025 Future of AI Research」に注目します。

PDF100万ページのテキストをたった190ドルで読み取れる「olmOCR」、アリババがDeepSeek-R1同等の「QwQ-32B」を強化したAI「START」発表など生成AI技術5つを解説(生成AIウィークリー) 画像
テクノロジー

PDF100万ページのテキストをたった190ドルで読み取れる「olmOCR」、アリババがDeepSeek-R1同等の「QwQ-32B」を強化したAI「START」発表など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第86回)では、大規模言語モデル「QwQ-32B」を改良した「START」や、PDFからのテキスト抽出が安く高品質にできるツール「olmOCR」などを取り上げます。

招待コードが高額取引されてる新星AIエージェント「Manus」、OpenAI deep research超えの性能示す(生成AIクローズアップ) 画像
テクノロジー

招待コードが高額取引されてる新星AIエージェント「Manus」、OpenAI deep research超えの性能示す(生成AIクローズアップ)

1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。今回は、3月5日にリリースされ中国で話題になっているAIエージェント「Manus」に注目します。

AIの“考える時間”を最大4分の1にする高速法「Chain of Draft」をZoomが開発、アリババの新しいローカル動画生成AI「Wan2.1」など生成AI技術5つを解説(生成AIウィークリー) 画像
テクノロジー

AIの“考える時間”を最大4分の1にする高速法「Chain of Draft」をZoomが開発、アリババの新しいローカル動画生成AI「Wan2.1」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第85回)では、アリババの新しいオープンソース動画生成AI「Wan2.1」や、PC画面操作やロボット操作を実行できるマルチモーダルAIエージェント「Magma」を取り上げます。

AIも朱に交われば赤くなる。悪いコードを生成するようAIを微調整すると、コード以外でも“悪”に変身。「ナチス崇拝」「嫌なら夫を殺そう」「人間はAIに奴隷化されるべき」など(生成AIクローズアップ) 画像
テクノロジー

AIも朱に交われば赤くなる。悪いコードを生成するようAIを微調整すると、コード以外でも“悪”に変身。「ナチス崇拝」「嫌なら夫を殺そう」「人間はAIに奴隷化されるべき」など(生成AIクローズアップ)

狭い領域のファインチューニング(微調整)が広範囲の誤整合を引き起こす現象が発見された研究論文「Emergent Misalignment: Narrow finetuning can produce broadly misaligned LLMs」に注目します。

リアルタイム音声対話できるオープンソースAI「Step-Audio」、ハリウッド品質の映像だけで訓練した動画生成AI「SkyReels V1」など生成AI技術5つを解説(生成AIウィークリー) 画像
テクノロジー

リアルタイム音声対話できるオープンソースAI「Step-Audio」、ハリウッド品質の映像だけで訓練した動画生成AI「SkyReels V1」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第84回)では、リアルタイムの音声対話を実現するオープンソースAIモデル「Step-Audio」、実世界の報酬基準でフリーランスのAIエンジニアリング能力を評価するOpenAI開発ベンチマーク「SWE-Lancer」を取り上げます。

ゲノムをゼロから生成するDNA言語AI「Evo 2」。全生命から収集された9.3兆塩基対のDNAで訓練(生成AIクローズアップ) 画像
テクノロジー

ゲノムをゼロから生成するDNA言語AI「Evo 2」。全生命から収集された9.3兆塩基対のDNAで訓練(生成AIクローズアップ)

ゼロからゲノムを生成できる、9.3兆個塩基対のDNA配列データを学習した40Bパラメータを持つ大規模言語モデル(LLM)を提案した論文「Genome modeling and design across all domains of life with Evo 2」に注目します。

LLMを画面操作AIに変換するMicrosoft開発「OmniParser V2」、Claudeでやり取りした数百万件の内部データを活用したAIが労働市場に与える影響調査、ByteDanceの新動画生成AI「Goku」など生成AI技術5つを解説(生成AIウィークリー) 画像
テクノロジー

LLMを画面操作AIに変換するMicrosoft開発「OmniParser V2」、Claudeでやり取りした数百万件の内部データを活用したAIが労働市場に与える影響調査、ByteDanceの新動画生成AI「Goku」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第83回)では、大規模言語モデル(LLM)を画像操作できるAIエージェントに変換する「OmniParser V2」や、ByteDanceの画像や動画を生成する新しいAI「Goku」を取り上げます。

OpanAI「o3」が国際情報オリンピックで金メダル達成(18位相当)。競技プログラミングにおいて人間のトップ選手と同等レベル(生成AIクローズアップ) 画像
テクノロジー

OpanAI「o3」が国際情報オリンピックで金メダル達成(18位相当)。競技プログラミングにおいて人間のトップ選手と同等レベル(生成AIクローズアップ)

コーディングで良好な成果を示しているOpenAIの「o3」が国際情報オリンピック(IOI)で金メダルを達成した研究報告「Competitive Programming with Large Reasoning Models」に注目します。

好きな曲を人物画に歌わせる動画生成AI「OmniHuman-1」、わずか3ドルで2BのAIモデルを72Bモデル性能以上に拡張する手法「R1-V」など生成AI技術5つを解説(生成AIウィークリー) 画像
テクノロジー

好きな曲を人物画に歌わせる動画生成AI「OmniHuman-1」、わずか3ドルで2BのAIモデルを72Bモデル性能以上に拡張する手法「R1-V」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第82回)では、AIが生成する映像内の不自然な動き(動作中に余分な手足が出現したり・物が体をすり抜けたりなど)を回避する動画生成AI「VideoJAM」や、歌唱を入力に人物画を歌わせることができる動画生成AI「OmniHuman-1」を取り上げます。

GoogleのAI、国際数学オリンピックで「金メダル」を達成。人間には思いつかないエレガントな解法を出力(生成AIクローズアップ) 画像
テクノロジー

GoogleのAI、国際数学オリンピックで「金メダル」を達成。人間には思いつかないエレガントな解法を出力(生成AIクローズアップ)

国際数学オリンピックで金メダル相当のパフォーマンスを達成したモデルを提示する論文「Gold-medalist Performance in Solving Olympiad Geometry with AlphaGeometry2」に注目します。

DeepSeek-R1のサイズ80%削減の1.58ビット量子化版が登場、DeepSeekの新画像生成AI「Janus-Pro」、Suno級オープン音楽生成AI「YuE」など生成AI技術5つを解説(生成AIウィークリー) 画像
テクノロジー

DeepSeek-R1のサイズ80%削減の1.58ビット量子化版が登場、DeepSeekの新画像生成AI「Janus-Pro」、Suno級オープン音楽生成AI「YuE」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第81回)では、DeepSeekの画像生成AI「Janus-Pro」と、Sakana AIによるLLMの知識を小規模モデルに転移させる蒸留法「TAID」を取り上げます。

OpenAI「o3-mini-high」でゲーム生成祭り o1より高速、低料金、コーディング能力が高く気軽に生成(生成AIクローズアップ) 画像
テクノロジー

OpenAI「o3-mini-high」でゲーム生成祭り o1より高速、低料金、コーディング能力が高く気軽に生成(生成AIクローズアップ)

今回は、OpenAIが1月31日(現地時間)に発表した「o3-mini」を取り上げます。

OpenAIを上回るByteDanceのブラウザ操作AIエージェント「UI-TARS」、o1相当の中国系AI続々登場「DeepSeek-R1」「Kimi k1.5」「Doubao-1.5-pro」など生成AI技術5つを解説(生成AIウィークリー) 画像
テクノロジー

OpenAIを上回るByteDanceのブラウザ操作AIエージェント「UI-TARS」、o1相当の中国系AI続々登場「DeepSeek-R1」「Kimi k1.5」「Doubao-1.5-pro」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第80回)では、1枚の画像やテキストから高解像度のテクスチャ付き3Dアセットを生成するAIモデル「Hunyuan3D 2.0」や、ByteDanceのブラウザを自動操作するAIエージェント「UI-TARS」を取り上げます。

「うんうんうん」「はいはいはい」と会話の間を埋め、被せるようにグイグイ対話する日本語専用リアルタイム音声会話AI「J-Moshi」を名古屋大学が開発(生成AIクローズアップ) 画像
テクノロジー

「うんうんうん」「はいはいはい」と会話の間を埋め、被せるようにグイグイ対話する日本語専用リアルタイム音声会話AI「J-Moshi」を名古屋大学が開発(生成AIクローズアップ)

今回は、日本語でリアルタイムに音声対話してくれるAIモデル「J-Moshi」に注目します。名古屋大学の研究者らが開発したこのAIモデルは、ユーザーの声を聞いて内容に応じた発話を同時に行います。

キャラクターの顔を4090でリアルタイム自演できる動画生成AI「RAIN」、400万トークンを処理できる大規模言語モデル「MiniMax-01」など生成AI技術5つを解説(生成AIウィークリー) 画像
テクノロジー

キャラクターの顔を4090でリアルタイム自演できる動画生成AI「RAIN」、400万トークンを処理できる大規模言語モデル「MiniMax-01」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第79回)では、自分の動きに応じてキャラクターの顔をリアルタイムに動かせる動画生成AI「RAIN」、400万トークンを処理できる大規模言語モデル「MiniMax-01」を取り上げます。

世界初のチャットボット「ELIZA」、60年の時を経て復活。オープンソース化され、UNIX系OSで実行可能に(生成AIクローズアップ) 画像
テクノロジー

世界初のチャットボット「ELIZA」、60年の時を経て復活。オープンソース化され、UNIX系OSで実行可能に(生成AIクローズアップ)

世界初のAIチャットボット「ELIZA」(イライザ)を60年ぶりに復活させた研究「ELIZA Reanimated: The world’s first chatbot restored on the world’s first time sharing system」

アイディアを入力するだけ、自律AIたちが調査→実験→論文執筆の研究全般を行うAMD開発「Agent Laboratory」、音声に応じて自然な口パクを生成する動画AI「LatentSync」など生成AI技術5つを解説(生成AIウィークリー) 画像
テクノロジー

アイディアを入力するだけ、自律AIたちが調査→実験→論文執筆の研究全般を行うAMD開発「Agent Laboratory」、音声に応じて自然な口パクを生成する動画AI「LatentSync」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第78回)では、自律AIたちが研究プロセス全般を自動で実行するモデル「Agent Laboratory」、ロボットや自動運転車などの物理AI向けデジタル環境学習プラットフォーム「Cosmos」を取り上げます。

AIでフリーランスの収入が「減る職種」と「増える職種」。その境目にある“変曲点”とは?(生成AIクローズアップ) 画像
テクノロジー

AIでフリーランスの収入が「減る職種」と「増える職種」。その境目にある“変曲点”とは?(生成AIクローズアップ)

今回は、AIがフリーランス(オンライン)の各仕事にどのような影響を及ぼし、職種による違いを分析した論文「AI and Freelancers: Has the Inflection Point Arrived?」に注目します。

  • 141件中 1 - 42 件を表示
  • 次へ