初代Pixel Watchの発売から3年。バンドの留め金部分を本体の穴にスライドさせてかちっと留める、独特の機構はずっと変わらないので、気づいたら正規モデル4本、サードパーティ製4本の計8本のバンドを購入していました。
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第121回)は、大規模言語モデル(LLM)の文章生成を高速化するNVIDIA開発の技術「TiDAR」や、画像に長文テキストを隠して埋め込めるAIを用いたステガノグラフィー技術「S²LM」を取り上げます。
2022年11月にChatGPTが公開されて以来、生成AIの普及は一気に加速しました。すでに日常的に使っている人もいる一方、「仕事にどう生かせばいいかわからない」「業務に定着しない」といった声もまだ多く聞こえます。
Googleの画像生成AIとしてImagenとかよりはるかに定着してしまったNano Banana。そのより高度なバージョン「Nano Banana Pro」が使えるようになり、さまざまな用途に使われています。その応用例の一つを紹介しましょう。
Googleは、画像生成・編集モデル「Nano Banana Pro(Gemini 3 Pro Image)」を発表しました。「Geminiの最先端の推論技術と実世界の知識を活用し、これまで以上に優れた情報視覚化を実現」するとGoogleは説明しています。
以前にレビューした、音声レコーダーにもなるイヤホン「viaim(ヴィエイム) RecDot」。そのviaimから、さらに進化した新モデル「viaim OpenNote」がMakuakeに登場しました。
Googleが、最新の生成AIモデルとなる「Gemini 3」をリリースしました。
KDDIが世界初の一般消費者向けパワードスーツ『Hypershell X Pro 外骨格』をau +1 collectionで発売しました。
KDDIが世界初の一般消費者向けパワードスーツ『Hypershell X Pro 外骨格』をau +1 collectionで発売しました。
今回は、依頼主とクリエイターの直接取引で絵師を騙す、AIを用いた詐欺事案を取り上げます。
OpenAIは、大規模言語モデルGPTの最新バージョンとなるGPT-5.1を発表しました。
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第120回)は、「トークン単位」ではなく「複数トークンの塊」で予測する計算効率を改善する技術「CALM」や、推論AIに複雑なパズルを解かせた後には有害な答えを生成するジェイルブレイク攻撃を取り上げます。
大規模言語モデル(LLM)の登場で、誰でも簡単に、非常に質の高い文章が作れるようになりました。この変化は、特に就職活動や仕事の応募といった場面で大きな影響を与えています。
生成AIのビジネス活用をテーマに、実践例や最新動向を解説するセミナーを11月12日に開催。
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第119回)は、中国発マルチモーダル大規模言語モデル「Emu3.5」や、無限に拡張できる3Dバーチャル世界を生成可能な「WorldGrow」を取り上げます。
生成AIのビジネス活用をテーマに、実践例や最新動向を解説するセミナーを11月12日に開催。
自分はYouTubeでゲーム実況のライブ配信を普段からよくやっているくらいなので、結構ゲームをプレイする方である。しかし、意外なことに、こうした携帯型ゲーミングPC(ゲーミングUMPC)でプレイする機会がほとんどなかった。
OpenAIはこれまでiOS版でしか提供されていなかった動画生成AIアプリ「Sora」のAndroid版をリリースしました。
OpenAIはショート動画制作投稿SNSのSoraアプリAndroid版を、日本を含む7カ国で公開しました。日本以外で公開された国・地域は、米国、カナダ、韓国、台湾、タイ、ベトナムです。
1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」、今回は、AIチャットボットへの入力(プロンプト)が、実はすべて保存されていたことを証明した論文「Language Models are Injective and Hence Invertible」を取り上げます。
Soraのキャラクターカメオは、実写の人間の登録ができませんそれを乗り越える方法がありました。
KDDIは、10月28日から29日の2日間に渡って開催された「KDDI SUMMIT 2025」で、Google Cloudとの戦略的提携を発表。
Soraアプリの登録が日本で招待なしで可能になり、本人以外でのカメオ登録ができるようになりました。
AI作曲サービスのNo.2であるUdioが音楽業界最大手のひとつであるユニバーサル・ミュージック・グループ(UMG) と提携を発表しました。数カ月前まで続いていたAI音楽をめぐる著作権訴訟の構図は一変することになります。
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第118回)は、既存の大規模言語モデル(LLM)を特定タスク向けに1.58ビット精度にファインチューニングする軽量アプローチ「BitNet Distillation」や、写真1枚から複数視点画像、動画までを入力に高精度3D空間を生成できるAIモデル「HunyuanWorld-Mirror」を取り上げます。
内容を深掘りしたいサイトのURLを入れるだけで、二人の対話によるポッドキャスト風音声や、図解付きの動画解説を生成してくれるGoogleのNotebookLM。
NTT西日本は、音声AI事業の「VOICENCE(ボイセンス)」を発表しました。
OpenAIが、音楽を生成するAIツールを開発している模様です。
今回は、大規模言語モデル(LLM)が低品質なウェブテキストに継続的に晒されることで、認知機能の低下を引き起こすことを明らかにした論文「LLMs Can Get “Brain Rot”!」を取り上げます。
日頃筆者が便利で使っているComfyUIのWorkflowをご紹介したい。
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第117回)は、過度な圧縮をしない画像生成AI技術「RAE」や、長時間動画をリアルタイムに理解できるAIモデル「StreamingVLM」を取り上げます。
OpenAIは10月21日、ChatGPTを統合し、ウェブブラウジング中にAIチャットボットとやり取りができるブラウザー「ChatGPT Atlas」を発表しました。macOS版がまずリリースされ、その後「近日中」にWindows版、iOS版、Android版が登場する予定です。
AIによるブラウザベースのエージェントがついに一線を超えました。自分的にですが。
テクノエッジ編集部では、生成AIグラビア実践ワークショップ第3期第5回を3月19日に開催します。今回はRTX 5090 GPUの生成AIへの活用について、特に解説します。
特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。
今回は、AIの生成において、同じような答えばかり返ってしまう問題を解決する方法を提案した論文「Verbalized Sampling: How to Mitigate Mode Collapse and Unlock LLM Diversity」を取り上げます。
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第116回)は、巨大AIを凌駕する、わずか700万パラメータの小型AI「TRM」や、AIが9,300人の顧客を演じて製品の購買意欲を予測する消費者調査シミュレーションシステムを取り上げます。
PLAUDが、AIボイスレコーダーのフラッグシップモデル「Plaud Note Pro(プラウド ノート プロ)」を10月14日に発売しました。価格は3万800円。製品とは関係ありませんが、法人としてのPLAUD株式会社はすべて大文字、ブランドとしてはPlaudで最初だけ大文字だそうです。
Qwen-Imageで大物txt2imgは終わりかなと思っていた矢先の9月9日、 HunyuanImage-2.1 がリリース。その後も怒涛のアップデートが起きている。
今回は、夢を脳波(EEG)信号で解読し、AIを用いて画像化するためのデータセット「Dream2Image」を提案した論文を取り上げます
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第115回)は、人脳の神経回路を模倣した言語モデル「Dragon Hatchling」や、リアルタイムに指示して途中で変更しながら長時間動画を生成するAI「LONGLIVE」を取り上げます。
リアルな登場人物を固定して使いたい場合にはどうしたら良いのでしょうか?
OpenAIが、AMDと数百億ドル規模のGPU供給契約を締結したと発表しました。