Claude Mythos/Fableで学習したとする無検閲AI「Qwythos-9B」GGUF版が登場、商用利用可能な120億パラメータの画像生成AI「Krea 2」など生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第150回)は、AIエージェントが動作する環境をシミュレートする言語モデル「Qwen-AgentWorld」、Claude Mythos/Fableで学習したと謳うローカル無検閲AI「Qwythos-9B」GGUF版を取り上げます。
Google、Gemini 3.5 FlashにPC・スマホ操作を自動実行する「コンピューター使用」機能を追加
Googleは、同社のAIモデル「Gemini 3.5 Flash」に、コンピューターの画面を認識して操作を実行する「コンピューター使用(computer use)」機能を組み込みツールとして統合したと発表しました。
文章からマンガを生成する東大開発の国産AI「MangaFlow」、軽量0.9Bで巨大モデル超える精度のオープンソース文書解析AI「PaddleOCR-VL-1.6」など生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第147回)は、NVIDIA開発の物理AI向けオープンソースの世界モデル「Cosmos 3」や、ノートPCで動くGoogleのマルチモーダルAI「Gemma 4 12B」を取り上げます。
Google AI Plusが大幅値下げでストレージ倍増、月725円で400GBとGemini Pro追加機能が利用可能に
Googleがサブスクリプションサービス「Google AI Plus」の月額料金を1200円から725円に値下げしました。あわせて、Googleサービスで共有のクラウドストレージ容量も200GBから400GBへと増量。
Appleの第3世代Foundation Model、ローカル動作する20Bモデルは「フラッシュに置く」新アーキテクチャでiPhone Airでも動くがM2 Macは切り捨て。だがスマホオンデバイスAIとしてはたぶん最強(CloseBox)
2026年6月8日、AppleのMachine Learning Researchに「Introducing the Third Generation of Apple's Foundation Models」という記事が静かに公開されました。
16GB RAMで高性能エージェントが動くGemma 4 12B、Google DeepMindが公開 26B MoEに迫る推論性能、エンコーダなしのマルチモーダル
・Gemma 4 12Bはノート PC上で動作可能な高性能マルチモーダルAIモデルで、16GBのVRAMまたは統合メモリで動作する
・エンコーダーフリーのユニファイドアーキテクチャを採用し、視覚・音声入力をLLMバックボーンに直接統合することで低遅延・低メモリを実現
・Apache 2.0ライセンスで公開され、Hugging Face・Kaggle・各種推論フレームワークに対応
もうカメラはいらない。写真撮らないし。そう思っていた僕が一晩で開発したiPhone異世界カメラアプリ(CloseBox)
自分だけのためのiPadギターアプリ「FretCaster」を作った次は、iPhoneアプリを作りました。今回作ったのは、カメラに映っている風景をそのまま画像生成するアプリです。ただし、いわゆるImage to Imageではありません。
1.58bitの波が画像生成に到来。iPhoneやMacBook Neoローカルでもリアルな画像を30秒で生成するBonsai Image Ternaryを試してみた(CloseBox)
PrismMLが、Bonsaiの画像版、Bonsai Image Ternaryをリリース。FLUX.2 Kleinの性能を大きく減じることなくデータサイズを数分の1に減らしたモデルです。
GoogleのAIメガネは今秋発売、サムスン協業の「インテリジェント・アイウェア」 Geminiのエージェント機能を音声で指示・確認
Googleは発表イベント Google I/O 2026で、Geminiが使えるメガネ「Intelligent Eyewear」を2026年秋に発売することを発表しました。
キーボード老害おじさんは、いったいどちらのキーボードの話をしているんだろう?(CloseBox)
「キーボード老害おじさん図鑑」というものを見かけました。
これは読まねば、と思いました。 キーボード老害。私の脳内には即座に、初期の電子ピアノのボコボコした感触、カシオトーンやポータサウンドの浅いミニ鍵盤、ヤマハDX7の軽いけど妙に味のあるタッチ、MIDI 1.0の31.25kbpsという絶妙な遅さが生むグルーヴについて夜通し語るおじさんたちの顔が浮かびました。
Google I/O 2026:「Gemini 3.5 Flash」と「Gemini Omni」などを発表
Google I/O 2026でGemini 3.5 FlashとGemini Omniを発表、検索や動画編集など多くの機能を追加しました。
GoogleがWear OS 7を発表。バッテリー最大10%改善とGemini Intelligence搭載
Googleは、スマートウォッチ向けプラットフォームの最新バージョン「Wear OS 7」を発表しました。
YouTubeが会話型検索「Ask YouTube」とAI動画リミックス機能を発表
YouTubeは5月19日より、動画の検索・発見体験を刷新する会話型検索機能「Ask YouTube」と、AIモデル「Gemini Omni」を活用したShorts向けリミックス機能の提供を開始しました。
アップル、WWDCで発表とうわさの新しいSiriにチャット履歴自動削除機能搭載か
アップルは、Google Geminiを搭載するスタンドアロンのSiriアプリを、6月のWWDCで発表するとうわさされています。
連載「歌うテックニュース」第7回:非力なGPUでパストレーシングが突然可能になった背後で暗躍するNVIDIA(西川善司)
今春、パストレ対応のゲームが日本のゲーム開発企業から2作品も発売されたのをご存じですか?
GeminiをAndroidに統合した『Gemini Intelligence』発表 エージェント的自動操作に対応、Galaxy・PixelスマホやGooglebookに提供
Googleは日本時間2026年5月13日、年次イベントGoogle I/Oに先立つ配信番組「The Android Show: I/O Edition 2026」で、GeminiをAndroid OSに組み込んだプラットフォーム「Gemini Intelligence」を発表しました。
GoogleのAndroid Autoが車内体験を刷新。駐車時に車内ディスプレイでYouTube再生、Gemini AIも進化
Android Autoが全面刷新され、3D没入型ナビゲーション・フルHD動画再生・Dolby Atmos対応の空間音響などプレミアム機能が追加されます
AI時代のノート『Googlebook』発表 GeminiとOS統合、Androidとシームレス連携 各社から今秋発売
Google I/Oに先立つ配信番組The Android Show: I/O Edition 2026 で、Googleが新しい種類のノートPC『Googlebook』を正式発表しました。
Apple Intelligence、iOS 27で好みのサードパーティAIモデルを使用可能になるかも?
アップルの次期バージョンのOSでは、ユーザーがApple Intelligenceで使用するAIモデルを選択可能になるかもしれません。
Google、Android版翻訳アプリにAIによる発音練習機能を搭載。リリース20周年記念
GoogleはAndroid版のGoogle翻訳アプリに、ユーザーが複数言語の発音を練習するための機能を追加しました。
HTCのAIグラスVIVE Eagleは8万円から 「ジェネリック レイバンメタ」仕様ながらオープンとプライバシー重視で差別化
HTC NIPPON株式会社は2026年4月24日、AIグラス「VIVE Eagle」を日本国内で発売します。
Gemini in Chrome日本上陸 複数タブまとめて比較・YouTube要約・Gmailやカレンダー連携など便利機能多数
Googleは2026年4月21日、Google ChromeにAI機能「Gemini in Chrome」を日本を含む複数地域で提供開始しました。
AIならサッカーくじを当てられる?英プレミアリーグで主要AIモデルに賭けさせた研究結果が発表
AIスタートアップ企業のGeneral Reasoningは、主要なAIモデルの現実世界に対する分析能力を調べるため、英国プレミアリーグの2023-24シーズンを仮想的に再現し、試合結果予想を競わせる「KellyBench」と称するシミュレーションを行いました。
ブラウザ上で完結するAI校正付き無料OCRツール「NDLOCR-Lite Web AI」登場。国立国会図書館「NDLOCR-Lite」を活用(生成AIクローズアップ)
1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。
2027年は「エージェンティックAI」「変態」がキーワード MWC 2026で見たスマホの未来
2027年のスマホはAIの進化と奇抜なデザインで変態的なモデルも登場し、新たなスタイルが拡大しそうです。
20人分の効率化。Y Combinator CEO独自開発のClaude Code用カスタムスキル「gstack」が無料公開。本業の傍ら1日1万行以上の実用的なコードを出力(生成AIクローズアップ)
Y CombinatorのCEOであるギャリー・タン氏(Garry Tan)が、自身のClaude Codeの開発環境「gstack」をGitHubでオープンソース(MITライセンス)として無料公開したことを取り上げます。
エージェンティックAIが既存ソフトの50%を代替し、使いこなしで大きな格差生む。「スーパーエージェント」立ち上げたBase44 CEO マオール・シュロモ氏に聞く(CloseBox)
Base44のCEOであるマオール・シュロモ氏に、ヴァイブ・コーディング、エージェンティックAI、そしてBase44の目指す未来について話を聞きました。
新連載「やってみようVibe Coding 」第1回。ヴァイブ・コーディングという言葉を聞いたことがありますか?(小泉勝志郎)
Vibe Coding(ヴァイブorバイブ・コーディング)って聞いたことありますか? 将棋の藤井聡太さんが「今年ハマったもの」としてこの言葉に触れていたんですよ。AIに作りたいものを日本語で伝えるとコードを書いてくれる、といった体験を語っていました。
Galaxy S26シリーズ発表イベント速報。覗き見防止にエージェントAI搭載。今宵のライブ配信で実機を披露(スマホ沼)
みなさんこんにちは、香港在住の携帯電話研究家、山根康宏です。サムスンから2026年向けフラッグシップモデル、Galaxy S26シリーズが登場しました!私はサンフランシスコで2026年2月25日(現地時間)開催の発表会イベント、Galaxy Unpackedに来ています。
GoogleがSunoのライバルサービスProducerAIを買収。AI作曲のエージェント化が進む中、明らかになったLyria 3との関係とその実力(CloseBox)
チャットベースのAI作曲サービスProducer.aiに、激震が走りました。2月24日、Google Labsへの参加が発表されたのです。
Geminiが歌を手に入れた。日本語の楽曲をチャットで作れるGoogle Lyria 3を使ってわかった限界(CloseBox)
Googleは2月18日、ボーカル入り楽曲生成を始めました。同社はLyriaという音楽生成AIをすでに提供していましたが、新バージョンのLyria 3でボーカル入り楽曲の生成を開始。日本語も含めた楽曲をGeminiのチャットインタフェースで提供しています。
Google「Genie 3」で“リアルタイム操作できる3Dゲーム”生成祭り。文章や画像から動き回れるバーチャル世界をサクッと作成(生成AIクローズアップ)
1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。今回は、Googleが一般公開(限定)を開始した3Dバーチャルワールドを生成でき、かつリアルタイムに動き回れるインタラクティブ世界モデル「Genie 3」を取り上げます。
エージェントAIでアプリも自動で操作する“真のAIスマホ” nubia M153が中国で登場(スマホ沼)
nubiaのM153はDoubaoエージェントAIでアプリ操作やタスク管理を自動化し、従来のスマホ利用を変革する可能性を示した。
6万円台も狙える格安フォルダブル「nubia Fold」を使って分かった、ZTEの“AI for ALL”が実装レベルで効いている理由(石野純也)
ZTEが開発し、ワイモバイルから発売されている“激安”フォルダブルスマホが「nubia Fold」です。
Google検索、Gemini 3をAI概要のデフォルトAIに設定。検索結果からAIモードへの移行も容易に
Googleは、検索結果に表示される「AIによる概要」のデフォルトAIモデルをGemini 3に変更しました。
数学未解決問題、AI単独で続々解決。フィールズ賞数学者が考えるAI証明の実態を「エルデシュ問題」から読み解く(生成AIクローズアップ)
1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。今回は、フィールズ賞受賞者であるテレンス・タオ教授が管理するGitHubページ「AI contributions to Erdős problems」を取り上げます。
アップル、次世代Siriの基盤にGoogle Geminiとそのクラウド技術を採用すると発表。「将来のApple Intelligence機能を強化」
Googleは、アップルと共同声明を発表し、アップル製品が搭載するAIアシスタント「Siri」や「Apple Intelligence」機能に対し、GoogleのGeminiモデルと、クラウドテクノロジーを基盤として搭載することを明らかにしました。
ポケモンバトルの最強AIはどれ? Gemini 、GPT、Claude、DeepSeek、Grokが総当たり戦した結果(生成AIクローズアップ)
1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。今回は、主要な大規模言語モデル(LLM)同士をポケモン(ポケットモンスター)バトルで戦わせた総当たり戦の結果を示した論文「Large Language Models as Pokémon Battle Agents: Strategic Play and Content Generation」を取り上げます。
LLMを機能不全に追い込む新型DoS攻撃「ThinkTrap」、論文からコードを生成するAI「DeepCode」など生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第124回)は、API経由でクローズド大規模言語モデル(LLM)にDoS攻撃できる手法「ThinkTrap」や、論文からコードを生成するAI「DeepCode」を取り上げます。
GoogleがGemini 3 Flashをリリース。さらに軽量化し、高い推論能力でを発揮
Googleが、先日のGemini 3 Proに続き、主に一般ユーザーと開発者に向けとなるGemini 3 Flashをリリースしました。
話し相手から頼れるエージェントへ。進化し続けたGoogle AIの2025年を振り返る(Google Tales)
毎月Googleさんに関連するよもやま話をお届けしているこの連載「Google Tales」も、今年最後の更新です。今回は激動の2025年の、GoogleのAIについて大まかに振り返ってみます。
iPhone版ChromeブラウザーへのGemini統合が米国で展開開始
Googleは9月に予告していたiOS版ChromeブラウザーアプリへのGemini機能統合の展開を開始しました。
- 130件中 1 - 42 件を表示
- 次へ
