Gemini

Claude Mythos/Fableで学習したとする無検閲AI「Qwythos-9B」GGUF版が登場、商用利用可能な120億パラメータの画像生成AI「Krea 2」など生成AI技術5つを解説(生成AIウィークリー) 画像
テクノロジー

Claude Mythos/Fableで学習したとする無検閲AI「Qwythos-9B」GGUF版が登場、商用利用可能な120億パラメータの画像生成AI「Krea 2」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第150回)は、AIエージェントが動作する環境をシミュレートする言語モデル「Qwen-AgentWorld」、Claude Mythos/Fableで学習したと謳うローカル無検閲AI「Qwythos-9B」GGUF版を取り上げます。

Google、Gemini 3.5 FlashにPC・スマホ操作を自動実行する「コンピューター使用」機能を追加 画像
テクノロジー

Google、Gemini 3.5 FlashにPC・スマホ操作を自動実行する「コンピューター使用」機能を追加

Googleは、同社のAIモデル「Gemini 3.5 Flash」に、コンピューターの画面を認識して操作を実行する「コンピューター使用(computer use)」機能を組み込みツールとして統合したと発表しました。

文章からマンガを生成する東大開発の国産AI「MangaFlow」、軽量0.9Bで巨大モデル超える精度のオープンソース文書解析AI「PaddleOCR-VL-1.6」など生成AI技術5つを解説(生成AIウィークリー) 画像
テクノロジー

文章からマンガを生成する東大開発の国産AI「MangaFlow」、軽量0.9Bで巨大モデル超える精度のオープンソース文書解析AI「PaddleOCR-VL-1.6」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第147回)は、NVIDIA開発の物理AI向けオープンソースの世界モデル「Cosmos 3」や、ノートPCで動くGoogleのマルチモーダルAI「Gemma 4 12B」を取り上げます。

Google AI Plusが大幅値下げでストレージ倍増、月725円で400GBとGemini Pro追加機能が利用可能に 画像
テクノロジー

Google AI Plusが大幅値下げでストレージ倍増、月725円で400GBとGemini Pro追加機能が利用可能に

Googleがサブスクリプションサービス「Google AI Plus」の月額料金を1200円から725円に値下げしました。あわせて、Googleサービスで共有のクラウドストレージ容量も200GBから400GBへと増量。

Appleの第3世代Foundation Model、ローカル動作する20Bモデルは「フラッシュに置く」新アーキテクチャでiPhone Airでも動くがM2 Macは切り捨て。だがスマホオンデバイスAIとしてはたぶん最強(CloseBox) 画像
テクノロジー

Appleの第3世代Foundation Model、ローカル動作する20Bモデルは「フラッシュに置く」新アーキテクチャでiPhone Airでも動くがM2 Macは切り捨て。だがスマホオンデバイスAIとしてはたぶん最強(CloseBox)

2026年6月8日、AppleのMachine Learning Researchに「Introducing the Third Generation of Apple's Foundation Models」という記事が静かに公開されました。

16GB RAMで高性能エージェントが動くGemma 4 12B、Google DeepMindが公開 26B MoEに迫る推論性能、エンコーダなしのマルチモーダル 画像
テクノロジー

16GB RAMで高性能エージェントが動くGemma 4 12B、Google DeepMindが公開 26B MoEに迫る推論性能、エンコーダなしのマルチモーダル

・Gemma 4 12Bはノート PC上で動作可能な高性能マルチモーダルAIモデルで、16GBのVRAMまたは統合メモリで動作する
・エンコーダーフリーのユニファイドアーキテクチャを採用し、視覚・音声入力をLLMバックボーンに直接統合することで低遅延・低メモリを実現
・Apache 2.0ライセンスで公開され、Hugging Face・Kaggle・各種推論フレームワークに対応

もうカメラはいらない。写真撮らないし。そう思っていた僕が一晩で開発したiPhone異世界カメラアプリ(CloseBox) 画像
テクノロジー

もうカメラはいらない。写真撮らないし。そう思っていた僕が一晩で開発したiPhone異世界カメラアプリ(CloseBox)

自分だけのためのiPadギターアプリ「FretCaster」を作った次は、iPhoneアプリを作りました。今回作ったのは、カメラに映っている風景をそのまま画像生成するアプリです。ただし、いわゆるImage to Imageではありません。

1.58bitの波が画像生成に到来。iPhoneやMacBook Neoローカルでもリアルな画像を30秒で生成するBonsai Image Ternaryを試してみた(CloseBox) 画像
テクノロジー

1.58bitの波が画像生成に到来。iPhoneやMacBook Neoローカルでもリアルな画像を30秒で生成するBonsai Image Ternaryを試してみた(CloseBox)

PrismMLが、Bonsaiの画像版、Bonsai Image Ternaryをリリース。FLUX.2 Kleinの性能を大きく減じることなくデータサイズを数分の1に減らしたモデルです。

GoogleのAIメガネは今秋発売、サムスン協業の「インテリジェント・アイウェア」 Geminiのエージェント機能を音声で指示・確認 画像
ガジェット

GoogleのAIメガネは今秋発売、サムスン協業の「インテリジェント・アイウェア」 Geminiのエージェント機能を音声で指示・確認

Googleは発表イベント Google I/O 2026で、Geminiが使えるメガネ「Intelligent Eyewear」を2026年秋に発売することを発表しました。

キーボード老害おじさんは、いったいどちらのキーボードの話をしているんだろう?(CloseBox) 画像
ガジェット

キーボード老害おじさんは、いったいどちらのキーボードの話をしているんだろう?(CloseBox)

「キーボード老害おじさん図鑑」というものを見かけました。

これは読まねば、と思いました。 キーボード老害。私の脳内には即座に、初期の電子ピアノのボコボコした感触、カシオトーンやポータサウンドの浅いミニ鍵盤、ヤマハDX7の軽いけど妙に味のあるタッチ、MIDI 1.0の31.25kbpsという絶妙な遅さが生むグルーヴについて夜通し語るおじさんたちの顔が浮かびました。

Google I/O 2026:「Gemini 3.5 Flash」と「Gemini Omni」などを発表 画像
テクノロジー

Google I/O 2026:「Gemini 3.5 Flash」と「Gemini Omni」などを発表

Google I/O 2026でGemini 3.5 FlashとGemini Omniを発表、検索や動画編集など多くの機能を追加しました。

GoogleがWear OS 7を発表。バッテリー最大10%改善とGemini Intelligence搭載 画像
ガジェット

GoogleがWear OS 7を発表。バッテリー最大10%改善とGemini Intelligence搭載

Googleは、スマートウォッチ向けプラットフォームの最新バージョン「Wear OS 7」を発表しました。

YouTubeが会話型検索「Ask YouTube」とAI動画リミックス機能を発表 画像
テクノロジー

YouTubeが会話型検索「Ask YouTube」とAI動画リミックス機能を発表

YouTubeは5月19日より、動画の検索・発見体験を刷新する会話型検索機能「Ask YouTube」と、AIモデル「Gemini Omni」を活用したShorts向けリミックス機能の提供を開始しました。

アップル、WWDCで発表とうわさの新しいSiriにチャット履歴自動削除機能搭載か 画像
テクノロジー

アップル、WWDCで発表とうわさの新しいSiriにチャット履歴自動削除機能搭載か

アップルは、Google Geminiを搭載するスタンドアロンのSiriアプリを、6月のWWDCで発表するとうわさされています。

連載「歌うテックニュース」第7回:非力なGPUでパストレーシングが突然可能になった背後で暗躍するNVIDIA(西川善司) 画像
ゲーム

連載「歌うテックニュース」第7回:非力なGPUでパストレーシングが突然可能になった背後で暗躍するNVIDIA(西川善司)

今春、パストレ対応のゲームが日本のゲーム開発企業から2作品も発売されたのをご存じですか?

GeminiをAndroidに統合した『Gemini Intelligence』発表 エージェント的自動操作に対応、Galaxy・PixelスマホやGooglebookに提供 画像
ガジェット

GeminiをAndroidに統合した『Gemini Intelligence』発表 エージェント的自動操作に対応、Galaxy・PixelスマホやGooglebookに提供

Googleは日本時間2026年5月13日、年次イベントGoogle I/Oに先立つ配信番組「The Android Show: I/O Edition 2026」で、GeminiをAndroid OSに組み込んだプラットフォーム「Gemini Intelligence」を発表しました。

GoogleのAndroid Autoが車内体験を刷新。駐車時に車内ディスプレイでYouTube再生、Gemini AIも進化 画像
テクノロジー

GoogleのAndroid Autoが車内体験を刷新。駐車時に車内ディスプレイでYouTube再生、Gemini AIも進化

Android Autoが全面刷新され、3D没入型ナビゲーション・フルHD動画再生・Dolby Atmos対応の空間音響などプレミアム機能が追加されます

AI時代のノート『Googlebook』発表 GeminiとOS統合、Androidとシームレス連携 各社から今秋発売 画像
テクノロジー

AI時代のノート『Googlebook』発表 GeminiとOS統合、Androidとシームレス連携 各社から今秋発売

Google I/Oに先立つ配信番組The Android Show: I/O Edition 2026 で、Googleが新しい種類のノートPC『Googlebook』を正式発表しました。

Apple Intelligence、iOS 27で好みのサードパーティAIモデルを使用可能になるかも? 画像
テクノロジー

Apple Intelligence、iOS 27で好みのサードパーティAIモデルを使用可能になるかも?

アップルの次期バージョンのOSでは、ユーザーがApple Intelligenceで使用するAIモデルを選択可能になるかもしれません。

Google、Android版翻訳アプリにAIによる発音練習機能を搭載。リリース20周年記念 画像
テクノロジー

Google、Android版翻訳アプリにAIによる発音練習機能を搭載。リリース20周年記念

GoogleはAndroid版のGoogle翻訳アプリに、ユーザーが複数言語の発音を練習するための機能を追加しました。

HTCのAIグラスVIVE Eagleは8万円から 「ジェネリック レイバンメタ」仕様ながらオープンとプライバシー重視で差別化 画像
ガジェット

HTCのAIグラスVIVE Eagleは8万円から 「ジェネリック レイバンメタ」仕様ながらオープンとプライバシー重視で差別化

HTC NIPPON株式会社は2026年4月24日、AIグラス「VIVE Eagle」を日本国内で発売します。

Gemini in Chrome日本上陸 複数タブまとめて比較・YouTube要約・Gmailやカレンダー連携など便利機能多数 画像
テクノロジー

Gemini in Chrome日本上陸 複数タブまとめて比較・YouTube要約・Gmailやカレンダー連携など便利機能多数

Googleは2026年4月21日、Google ChromeにAI機能「Gemini in Chrome」を日本を含む複数地域で提供開始しました。

AIならサッカーくじを当てられる?英プレミアリーグで主要AIモデルに賭けさせた研究結果が発表 画像
テクノロジー

AIならサッカーくじを当てられる?英プレミアリーグで主要AIモデルに賭けさせた研究結果が発表

AIスタートアップ企業のGeneral Reasoningは、主要なAIモデルの現実世界に対する分析能力を調べるため、英国プレミアリーグの2023-24シーズンを仮想的に再現し、試合結果予想を競わせる「KellyBench」と称するシミュレーションを行いました。

ブラウザ上で完結するAI校正付き無料OCRツール「NDLOCR-Lite Web AI」登場。国立国会図書館「NDLOCR-Lite」を活用(生成AIクローズアップ) 画像
テクノロジー

ブラウザ上で完結するAI校正付き無料OCRツール「NDLOCR-Lite Web AI」登場。国立国会図書館「NDLOCR-Lite」を活用(生成AIクローズアップ)

1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。

2027年は「エージェンティックAI」「変態」がキーワード MWC 2026で見たスマホの未来 画像
ガジェット

2027年は「エージェンティックAI」「変態」がキーワード MWC 2026で見たスマホの未来

2027年のスマホはAIの進化と奇抜なデザインで変態的なモデルも登場し、新たなスタイルが拡大しそうです。

20人分の効率化。Y Combinator CEO独自開発のClaude Code用カスタムスキル「gstack」が無料公開。本業の傍ら1日1万行以上の実用的なコードを出力(生成AIクローズアップ) 画像
テクノロジー

20人分の効率化。Y Combinator CEO独自開発のClaude Code用カスタムスキル「gstack」が無料公開。本業の傍ら1日1万行以上の実用的なコードを出力(生成AIクローズアップ)

Y CombinatorのCEOであるギャリー・タン氏(Garry Tan)が、自身のClaude Codeの開発環境「gstack」をGitHubでオープンソース(MITライセンス)として無料公開したことを取り上げます。

エージェンティックAIが既存ソフトの50%を代替し、使いこなしで大きな格差生む。「スーパーエージェント」立ち上げたBase44 CEO マオール・シュロモ氏に聞く(CloseBox) 画像
テクノロジー

エージェンティックAIが既存ソフトの50%を代替し、使いこなしで大きな格差生む。「スーパーエージェント」立ち上げたBase44 CEO マオール・シュロモ氏に聞く(CloseBox)

Base44のCEOであるマオール・シュロモ氏に、ヴァイブ・コーディング、エージェンティックAI、そしてBase44の目指す未来について話を聞きました。

新連載「やってみようVibe Coding 」第1回。ヴァイブ・コーディングという言葉を聞いたことがありますか?(小泉勝志郎) 画像
テクノロジー

新連載「やってみようVibe Coding 」第1回。ヴァイブ・コーディングという言葉を聞いたことがありますか?(小泉勝志郎)

Vibe Coding(ヴァイブorバイブ・コーディング)って聞いたことありますか? 将棋の藤井聡太さんが「今年ハマったもの」としてこの言葉に触れていたんですよ。AIに作りたいものを日本語で伝えるとコードを書いてくれる、といった体験を語っていました。

Galaxy S26シリーズ発表イベント速報。覗き見防止にエージェントAI搭載。今宵のライブ配信で実機を披露(スマホ沼) 画像
ガジェット

Galaxy S26シリーズ発表イベント速報。覗き見防止にエージェントAI搭載。今宵のライブ配信で実機を披露(スマホ沼)

みなさんこんにちは、香港在住の携帯電話研究家、山根康宏です。サムスンから2026年向けフラッグシップモデル、Galaxy S26シリーズが登場しました!私はサンフランシスコで2026年2月25日(現地時間)開催の発表会イベント、Galaxy Unpackedに来ています。

GoogleがSunoのライバルサービスProducerAIを買収。AI作曲のエージェント化が進む中、明らかになったLyria 3との関係とその実力(CloseBox) 画像
テクノロジー

GoogleがSunoのライバルサービスProducerAIを買収。AI作曲のエージェント化が進む中、明らかになったLyria 3との関係とその実力(CloseBox)

チャットベースのAI作曲サービスProducer.aiに、激震が走りました。2月24日、Google Labsへの参加が発表されたのです。

Geminiが歌を手に入れた。日本語の楽曲をチャットで作れるGoogle Lyria 3を使ってわかった限界(CloseBox) 画像
テクノロジー

Geminiが歌を手に入れた。日本語の楽曲をチャットで作れるGoogle Lyria 3を使ってわかった限界(CloseBox)

Googleは2月18日、ボーカル入り楽曲生成を始めました。同社はLyriaという音楽生成AIをすでに提供していましたが、新バージョンのLyria 3でボーカル入り楽曲の生成を開始。日本語も含めた楽曲をGeminiのチャットインタフェースで提供しています。

Google「Genie 3」で“リアルタイム操作できる3Dゲーム”生成祭り。文章や画像から動き回れるバーチャル世界をサクッと作成(生成AIクローズアップ) 画像
テクノロジー

Google「Genie 3」で“リアルタイム操作できる3Dゲーム”生成祭り。文章や画像から動き回れるバーチャル世界をサクッと作成(生成AIクローズアップ)

1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。今回は、Googleが一般公開(限定)を開始した3Dバーチャルワールドを生成でき、かつリアルタイムに動き回れるインタラクティブ世界モデル「Genie 3」を取り上げます。

エージェントAIでアプリも自動で操作する“真のAIスマホ” nubia M153が中国で登場(スマホ沼) 画像
ガジェット

エージェントAIでアプリも自動で操作する“真のAIスマホ” nubia M153が中国で登場(スマホ沼)

nubiaのM153はDoubaoエージェントAIでアプリ操作やタスク管理を自動化し、従来のスマホ利用を変革する可能性を示した。

6万円台も狙える格安フォルダブル「nubia Fold」を使って分かった、ZTEの“AI for ALL”が実装レベルで効いている理由(石野純也) 画像
ガジェット

6万円台も狙える格安フォルダブル「nubia Fold」を使って分かった、ZTEの“AI for ALL”が実装レベルで効いている理由(石野純也)

ZTEが開発し、ワイモバイルから発売されている“激安”フォルダブルスマホが「nubia Fold」です。

Google検索、Gemini 3をAI概要のデフォルトAIに設定。検索結果からAIモードへの移行も容易に 画像
テクノロジー

Google検索、Gemini 3をAI概要のデフォルトAIに設定。検索結果からAIモードへの移行も容易に

Googleは、検索結果に表示される「AIによる概要」のデフォルトAIモデルをGemini 3に変更しました。

数学未解決問題、AI単独で続々解決。フィールズ賞数学者が考えるAI証明の実態を「エルデシュ問題」から読み解く(生成AIクローズアップ) 画像
テクノロジー

数学未解決問題、AI単独で続々解決。フィールズ賞数学者が考えるAI証明の実態を「エルデシュ問題」から読み解く(生成AIクローズアップ)

1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。今回は、フィールズ賞受賞者であるテレンス・タオ教授が管理するGitHubページ「AI contributions to Erdős problems」を取り上げます。

アップル、次世代Siriの基盤にGoogle Geminiとそのクラウド技術を採用すると発表。「将来のApple Intelligence機能を強化」 画像
テクノロジー

アップル、次世代Siriの基盤にGoogle Geminiとそのクラウド技術を採用すると発表。「将来のApple Intelligence機能を強化」

Googleは、アップルと共同声明を発表し、アップル製品が搭載するAIアシスタント「Siri」や「Apple Intelligence」機能に対し、GoogleのGeminiモデルと、クラウドテクノロジーを基盤として搭載することを明らかにしました。

ポケモンバトルの最強AIはどれ? Gemini 、GPT、Claude、DeepSeek、Grokが総当たり戦した結果(生成AIクローズアップ) 画像
テクノロジー

ポケモンバトルの最強AIはどれ? Gemini 、GPT、Claude、DeepSeek、Grokが総当たり戦した結果(生成AIクローズアップ)

1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。今回は、主要な大規模言語モデル(LLM)同士をポケモン(ポケットモンスター)バトルで戦わせた総当たり戦の結果を示した論文「Large Language Models as Pokémon Battle Agents: Strategic Play and Content Generation」を取り上げます。

LLMを機能不全に追い込む新型DoS攻撃「ThinkTrap」、論文からコードを生成するAI「DeepCode」など生成AI技術5つを解説(生成AIウィークリー) 画像
テクノロジー

LLMを機能不全に追い込む新型DoS攻撃「ThinkTrap」、論文からコードを生成するAI「DeepCode」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第124回)は、API経由でクローズド大規模言語モデル(LLM)にDoS攻撃できる手法「ThinkTrap」や、論文からコードを生成するAI「DeepCode」を取り上げます。

GoogleがGemini 3 Flashをリリース。さらに軽量化し、高い推論能力でを発揮 画像
テクノロジー

GoogleがGemini 3 Flashをリリース。さらに軽量化し、高い推論能力でを発揮

Googleが、先日のGemini 3 Proに続き、主に一般ユーザーと開発者に向けとなるGemini 3 Flashをリリースしました。

話し相手から頼れるエージェントへ。進化し続けたGoogle AIの2025年を振り返る(Google Tales) 画像
テクノロジー

話し相手から頼れるエージェントへ。進化し続けたGoogle AIの2025年を振り返る(Google Tales)

毎月Googleさんに関連するよもやま話をお届けしているこの連載「Google Tales」も、今年最後の更新です。今回は激動の2025年の、GoogleのAIについて大まかに振り返ってみます。

iPhone版ChromeブラウザーへのGemini統合が米国で展開開始 画像
テクノロジー

iPhone版ChromeブラウザーへのGemini統合が米国で展開開始

Googleは9月に予告していたiOS版ChromeブラウザーアプリへのGemini機能統合の展開を開始しました。

  • 130件中 1 - 42 件を表示
  • 次へ