
巨大AIを打ち負かす、わずか700万パラメータの超小型AI「TRM」、著者自身が論文プレゼンする動画を自動生成するAI「PaperTalker」など生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第116回)は、巨大AIを凌駕する、わずか700万パラメータの小型AI「TRM」や、AIが9,300人の顧客を演じて製品の購買意欲を予測する消費者調査シミュレーションシステムを取り上げます。

「なぜLLMは“掛け算”ができないのか」解明、ニューロンやシナプスっぽく動く脳を真似した新言語AI「Dragon Hatchling」など生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第115回)は、人脳の神経回路を模倣した言語モデル「Dragon Hatchling」や、リアルタイムに指示して途中で変更しながら長時間動画を生成するAI「LONGLIVE」を取り上げます。

Sora 2がリアルな人物を固定できない問題。プロンプトオンリーメソッドはAPI開放で不要に?(CloseBox)
リアルな登場人物を固定して使いたい場合にはどうしたら良いのでしょうか?

NVIDIAが出資のOpenAI、6ギガワット分のAMD製GPUでAIインフラ整備。AMD株も最大で10%取得へ
OpenAIが、AMDと数百億ドル規模のGPU供給契約を締結したと発表しました。

OpenAIサム・アルトマンとジョナサン・アイブのコラボAI製品、「技術的問題」で開発難航中との報。プライバシーの対処などに苦慮か
OpenAIのサム・アルトマンCEOと元アップルのチーフデザイナーであるジョナサン・アイブ氏が手掛ける「新世代のAI搭載コンピューター製品」の開発が難航している模様です。

Sora 2で生成の動画、別SNSに“AI素性隠して”大量投稿し再生数荒稼ぎ ウォーターマークを消すツールとアルトマン氏の著作権への対応(生成AIクローズアップ)
今回は動画生成AI「Sora 2」を悪用する動きと、OpenAIのサム・アルトマンCEOが著作権に関した今後の変更方針を言及した内容を取り上げます。

自分を他の動画にカメオ出演させられるOpenAIの動画生成AI「Sora 2」を使ってみた。iPhone必須&招待制で日本も対象に(CloseBox)
OpenAIは10月1日(米国では9月30日)、動画生成AIモデルであるSoraの次期バージョン、「Sora 2」を発表しました。

VC以上の目利きAI「VCBench」、OpenAIのDeep Researchと同等性能のオープンソースAIエージェント「Tongyi DeepResearch」など生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第113回)は、AIの世界理解を向上させる大規模データセット「OmniWorld」や、アリババグループ開発のオープンソースAIエージェント「Tongyi DeepResearch」を取り上げます。

OpenAI、ChatGPTが朝イチに知りたい情報をまとめてくれる新機能「 Pulse」を発表。月額200ドルのProプランユーザー向け
OpenAIは、月額200ドル(約3万円)のChatGPT Proプランに新機能「Pulse」を追加すると発表しました。

NVIDIAがOpenAIに最大1000億ドル投資へ。10GWのAIインフラを段階的に導入予定
NVIDIAは、ChatGPTを開発するOpenAIに最大1000億ドル(約14兆7800億円)を投資し、同社のAI向けGPU数百万基を使用する、最大10GWの「次世代AIインフラ」を構築することを明らかにしました。

AIに同じ質問をするとなぜ毎回違う答えなのか? 元OpenAIチームが解明。毎回同じ返答をする新システムも開発など生成AI技術5つを解説(生成AIウィークリー)
AIに同じ質問すると毎回微妙に違う返答になる謎を解き明かした研究や、バイトダンスが開発した文字・画像・音声から話す人物動画を生成できるAIモデル「HuMo」を取り上げます。

OpenAI、18歳未満ChatGPTユーザーに導入する制限について説明。「10代の若者のプライバシーと自由よりも安全を優先」へ
OpenAIは、ChatGPTが18歳未満のユーザーと接する際に、プライバシーや自由な会話よりも安全性を優先するためのポリシー変更を行うことを明らかにしました。

OpenAI、「幻覚」の根本原因と対策を解明。ハルシネーションは「難問に直面した学生と同じ」(生成AIクローズアップ)
今回は、OpenAIとジョージア工科大学の研究チームが発表した論文「Why Language Models Hallucinate」を取り上げます。大規模言語モデル(LLM)がなぜ事実と異なる情報「幻覚」(ハルシネーション)を自信満々に生成してしまうのか、その根本原因を明らかにして解決策を提案した研究です。

MacBook Proで動くOpenAI gpt-oss-120bで、門外不出AIアバターとの音声対話システムを構築できた(CloseBox)
OpenAIがオープンソース公開したLMM(大規模言語モデル)「gpt-oss-120b」を、128GBのUnified Memoryを搭載したMacBook Pro(M4 Max)で動かしています。

わたしのChatGPT 4oを返して! GPT-5登場で失われた旧AIの復活願う#keep4o運動を最新AIはこう分析する(CloseBox)
ChatGPTがGPT-5にバージョンアップし、4oをはじめとするそれまでの主要AIモデルは使えなくなりました。性能が上がるのだからいいのでは、と思いがちですが、大きな反発がSNSで寄せられています。
X上では#keep4oというハッシュタグが生まれ、そこにはユーザーたちの切実な復活への願いが寄せられています。
こうした運動の現状と分析を、各社の最新AIにやってもらいました。

GPT-5はgpt-oss-120b、Claude Opus 4.1とどのくらい違う? 小説執筆とヴァイブ・コーディングで試してみた(CloseBox)
OpenAIはチャット型大規模言語モデルの最新版である「GPT-5」を発表しました。筆者のところにはまだブラウザには来ておらず、iPhoneアプリのみ使える状態ですが、取り急ぎ、使ってみた感想をレポートします。

Google Cloud、自然言語からデータ分析用のPythonコードを生成し実行する「Code Interpreter」をプレビュー公開
Google Cloudは、ビジネスユーザーからの自然言語による質問を基にデータ分析用のPythonコードを生成し実行する新機能「Code Interpreter」をプレビュー公開しました。

俺の128GB MacBook Proが真価を発揮する時がきた。ChatGPT o4-mini並みのgpt-oss-120bがローカルで動いてるよ(CloseBox)
やってきましたね。世の中のPCユーザーたちがMacユーザーを羨望の眼差しで見るときが。

OpenAI、ChatGPTに『学習モード』を追加。学生の「考える力」を育むため
OpenAIは、ChatGPTに新機能「学習モード(Study Mode)」を追加したと発表しました。

11歳児が書いた作文をAIが分析したら、22年後の最終学歴を高い精度で予測できた(生成AIクローズアップ)
今回は、子どもが11歳のときに書いた短い作文から、その子の将来の最終学歴や認知能力をAIが予測できるかを調査した論文「Large language models predict cognition and education close to or better than genomics or expert assessment」を取り上げます。

Windsurf、競合AI開発環境Devinの開発元Cognitionに買収される。OpenAIとの破談、Googleによる幹部引き抜きの末に
OpenAIによるWindsurf買収が破談となり、創業者や主要開発者がGoogleに引き抜かれましたが、残ったWindsurfの行方が決まりました。

OpenAIのWindsurf買収をGoogleが幹部引き抜きで阻止し、AIコードエディタへ進出か。Windsurfサービスは開発継続表明
主要なAIコードエディタの1つである「Windsurf」を開発する同名のWindsurfは、同社CEOであるVarun Mohan氏、共同創業者のDouglas Chen氏、および同社の研究開発部門の社員数名が、Googleに移籍したことを発表しました。

Metaが元OpenAIの著名研究者を雇用。独自のAI推論モデル開発体制を強化
Metaは、AI推論モデルの開発を強化加速するために、元OpenAIの研究者、トラピット・バンサル氏を迎え入れたと伝えられています。

OpenAIのアルトマンCEO解任騒動が映画化?アマゾンMGMスタジオ、グァダニーノ監督と交渉中
Amazon MGMスタジオは2023年に起こった、OpenAIの協働創業者サム・アルトマンCEOが突如解任され、5日後に復帰した一連の騒動を映画化すべく準備を進めている模様です。

OpenAI、ジョニー・アイヴのAIスタートアップioを買収。AIのための新デバイスは2026年登場へ(CloseBox)
OpenAIは5月22日、Appleの最高デザイン責任者だったジョニー・アイヴ率いるAIスタートアップ企業「io」を買収したと発表しました。

ChatGPTの媚びすぎ問題、利用者の「いいね」等に過剰反応が原因。GPT-4oモデル巻き戻しで対応、複数の個性から選択式へ
最近のChatGPTが過度にユーザーを褒め称えたり、回答の正しさよりも迎合を優先すると批判が高まっていた件について。

OpenAI、ChatGPTが未成年ユーザの猥談相手になってしまう「バグ」を修正へ
OpenAIは、ChatGPTが18歳未満の未成年ユーザーとのチャットで性的に露骨な画像を生成したり、NFSWな会話を展開するのを制限するための修正を「積極的に行っている」と述べています。

Adobe Fireflyが大幅強化、GoogleやOpenAI・Flux他の生成AIモデルも統合。モバイルアプリも近日提供
ロンドンで開催中のイベント Adobe MAX London 2025で、アドビがクリエイティブAIソリューション Firefly の最新アップデートを披露しました。

OpenAI幹部、GoogleのChrome事業が・売却されれば買収に興味ありと述べる
火曜日、ワシントンで行われたGoogleに対する反トラスト法裁判で、OpenAI幹部のニック・ターリー氏は、もしGoogleからChromeブラウザー事業が分割・売却されるならば、それを買収することに興味があると述べました。

AIに「逆転裁判」をプレイさせ、推論能力が一番高かったのはどのLLM?(生成AIクローズアップ)
1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。今回は、AIモデルに「逆転裁判」をプレイさせて推論能力を調査した内容を取り上げます。

1分超えたいなら動画生成はローカルAIを選べ。6GB VRAMでも動くオープンソースAI「FramePack」の実力は本物か、試してみた(CloseBox)
本日2本目のAI記事。ControlNet、WebUI Forge、Fooocusなど、画像生成AIソフトに多大な貢献をしてきたlllyasvielさんが、動画生成AIの新しいオープンソースソフト「FramePack」を公開しました。NVIDIA GPU専用ですが、WindowsとLinuxですぐに使えます。

まるで映画「ブレードランナー」のあのシーン。古い写真の撮影場所をChatGPT o3が12分かけて特定したそのやり方がすごい(CloseBox)
OpenAIのChatGPT o3とo4-mini、o4-mini-highが投入されてすぐに試したのは、o3による音楽解析でした。その日のうちにもう1つ、試してみたので今回はそちらをご報告します。それは、写真分析です。

ChatGPT o3は耳コピもできるってよ。AIで作った曲の分析・改善提案からコードの採譜まで可能に(CloseBox)
OpenAIがChatGPTのLLM(大規模言語モデル)の新モデル、o3とo4-mini、o4-mini、o4-mini-highを公開しました。現在ではPlus、Pro、Teamユーザーが使えます。

XのGrok 3に画像をプロンプトで加工できるEdit Imageがやってきた。ChatGPTより制限ゆるめだがその実力は?(CloseBox)
Xに搭載されているLLM(大規模言語モデル)のGrok(現在はGrok 3 beta)に、Edit Imageという画像編集機能が追加されました。

ChatGPT AI音声とおしゃべりしたら「まったくやる気が湧かないですね」「何か文句でも」との答えにどんよりした(CloseBox)
米国時間の4月1日、Mondayという新しいAIボイスがChatGPTに登場しました。

ChatGPT 4oの画像生成でテキスト能力が上がったらしいので、手書き文字からロゴを生成してみた(CloseBox)
OpenAIがまたYouTubeライブで発表をしました。今回のモデルはChatGPT 4oと、いささか古いのですが、その画像生成についての進展がテーマです。

PDF100万ページのテキストをたった190ドルで読み取れる「olmOCR」、アリババがDeepSeek-R1同等の「QwQ-32B」を強化したAI「START」発表など生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第86回)では、大規模言語モデル「QwQ-32B」を改良した「START」や、PDFからのテキスト抽出が安く高品質にできるツール「olmOCR」などを取り上げます。

招待コードが高額取引されてる新星AIエージェント「Manus」、OpenAI deep research超えの性能示す(生成AIクローズアップ)
1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。今回は、3月5日にリリースされ中国で話題になっているAIエージェント「Manus」に注目します。

LLMを画面操作AIに変換するMicrosoft開発「OmniParser V2」、Claudeでやり取りした数百万件の内部データを活用したAIが労働市場に与える影響調査、ByteDanceの新動画生成AI「Goku」など生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第83回)では、大規模言語モデル(LLM)を画像操作できるAIエージェントに変換する「OmniParser V2」や、ByteDanceの画像や動画を生成する新しいAI「Goku」を取り上げます。

OpanAI「o3」が国際情報オリンピックで金メダル達成(18位相当)。競技プログラミングにおいて人間のトップ選手と同等レベル(生成AIクローズアップ)
コーディングで良好な成果を示しているOpenAIの「o3」が国際情報オリンピック(IOI)で金メダルを達成した研究報告「Competitive Programming with Large Reasoning Models」に注目します。

PerplexityがDeep Research提供開始。無料ユーザーでも1日5回、Proなら500回利用可能に。実際に試してみた(CloseBox)
統合型チャットAIサービスであるPerplexityが新サービスをリリースしました。「Deep Research」オプションの追加です。

ワープ、ハイパードライブ、無慣性航法からアルクビエレ・ドライブまで、超光速(FTL)移動技術に関するdeep research調査報告をベッドの中から作らせた(CloseBox)
超光速。FTL(Faster Than Light)とも呼ばれることがある、SFファンならおなじみの移動手段です。それに近い技術をどこかが開発したとか実現不可能だと分かったとか、断片的な報道がたまにされています。
- 154件中 1 - 42 件を表示
- 次へ