OpenAIのChatGPT o3とo4-mini、o4-mini-highが投入されてすぐに試したのは、o3による音楽解析でした。その日のうちにもう1つ、試してみたので今回はそちらをご報告します。それは、写真分析です。
OpenAIがChatGPTのLLM(大規模言語モデル)の新モデル、o3とo4-mini、o4-mini、o4-mini-highを公開しました。現在ではPlus、Pro、Teamユーザーが使えます。
ミラノの公共交通はスマホアプリでチケット購入が可能で、QRコードでスムーズに乗車。24時間券や3日券が便利で、移動が快適。電波も良好で、観光にも適している。
今回は、大規模言語モデル(LLM)が人間の本質をどのように捉えているかを調査した論文「Measurement of LLM’s Philosophies of Human Nature」を取り上げます。
一部ユーザーにのみ開放され、それ以外の人はウェイティングリストに登録するだけ……そんな状態が続いていたGoogleの動画生成AIサービス「Veo 2」が、Gemini Advancedでロールアウト開始しました。
テクノエッジ編集部は、AIグラビア、ゲームAI、音楽・動画AI、そしてヴァイブ・コーディングなど、生成AIの最新動向を解説するイベントを5月20日19時から開催します。
先週金曜日、シリコンバレー周辺の一部の横断歩道で、歩行者横断用のボタンを押すと信号待ちの間にイーロン・マスク氏やドナルド・トランプ大統領、マーク・ザッカーバーグ氏らのAI音声による小話が聞けるようになりました。地元紙Palo Alto Onlineによると、これは何者かが歩行者用ボタンをハッキングしたために起こった事案であるようです。
Xに搭載されているLLM(大規模言語モデル)のGrok(現在はGrok 3 beta)に、Edit Imageという画像編集機能が追加されました。
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第90回)では、写真内の人物をテキスト指示に応じたアニメーション映像を生成する動画AI「DreamActor-M1」や、テキストから映画級の人物映像を生成できる動画AI「MoCha」をご紹介します。
OpenAIはChatGPTの過去のチャット履歴全てを参照できるオプションの提供を始めました。
4月1日に「Apple Intelligence」が日本語対応したのに伴い、日本市場でもAIスマホの注目度が高まっています。
Google Cloudは、日本時間で今日(2025年4月10日)未明に開幕した「Google Cloud Next 2025」において、AIエージェントの開発を容易にするフレームワーク「Agent Development Kit」をオープンソースとして公開することを発表しました。
KDDIは松田浩路(まつだ・ひろみち)新社長の就任会見を4月10日に行ったのですが、その場で衛星とauのスマホを直接通信する「au Starlink Direct」を発表しました。
GoogleがA2A Protocolを発表しました。最近注目されているAIエージェントを複数動作させる場合の標準プロトコルを提唱するというものですが、これを見て、「30年前のあの技術の再発明か」と思ったのは私だけではないようです。
全日本空輸(ANA)は、長距離国際線ボーイング787-9型機に、RECARO Aircraft Seating社(以下、RECARO社)の最新モデルシートを導入すると発表しました。
きのう完成させたばかりのミュージックビデオが早くも作り直しです。Take 2を公開しました。どうしてそうなったかというと、現在メインで使っている動画生成AIサービスのRunway Gen-4に新しく高速モードが登場したからです。
最近、曲を作りました。AIで。そのワークフローがいろいろなAIツールを少しずつ使っていく、ちょっと面白いものだったので、その流れを紹介しつつ、最近のAIツールについて紹介していければと思います。
今回は、アイデアを自然言語で入力するだけでブラウザ上でゲームやWebサイトを生成できる完全無料でオープンソースなヴァイブコーディングAI「DeepSite」を取り上げます。
AI動画生成を「25秒まで生成できます」「5フレーム分の画像から生成できます」というところが現れました。それがPikaです。
4月5日、モバイルWi-Fiルーター事業を主体とするuCloudlink Japanはメディア向けの説明会を開催。同社が新たに展開するライフシリーズの新製品として、MWC25で発表されたペット向けスマートデバイス「PetPhone」について紹介しました。
マイニンテンドーストアが Nintendo Switch 2 抽選販売の受付を開始しました。第一回抽選の申し込み受付は4月16日11時まで。
今回は別の記事を書いていたのですが、Midjourneyの新バージョンであるV7を試してみたらすごいことになっていたので急遽切り替えて、こちらをレポートすることにしました。
米国時間の4月1日、Mondayという新しいAIボイスがChatGPTに登場しました。
エントリーモデル「POCO M7 Pro 5G」が発売。MediaTek Dimensity 7025 Ultra搭載、8GBメモリ、256GBストレージ、5000万画素カメラなどを備え、価格は3万2980円とコスパに優れます。
金属製キーキャップAwekeysの国内向けクラウドファンディング終了が残り一週間に迫りました。
4月1日、iPhone、iPad、Mac、Apple Watch、そしてVision Proまでが一斉にアップデートされました。この大型アップデート最大のポイントは、日本でApple Intelligenceが使えるようになったことです。
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第89回)では、リアルタイムで動作する対話可能なAI搭載実写3Dアバターを生成できる技術「TaoAvatar」、テキストや映像などを認識しながら同時にテキストや音声応答できるAIモデル「Qwen2.5-Omni」を取り上げます。
いきなり登場したReve Image。当たると「え?これデジイチで撮った写真!?」的な画像が生成され、明らかにFLUX.1 [dev]を超えている。
今回は、AGI(汎用人工知能)の進歩を測定するために設計された新しいベンチマークテスト「ARC-AGI-2」が登場し、最先端のAIモデルが挑戦した、その結果報告を取り上げます。
Xでローカル生成AIのためのマシンはこんなのがいいんじゃないか?と投稿してみたのですが、予想外に反響があったので、ChatGPT deep researchを使ってまとめてみました。
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第88回)では、高解像度な3Dメッシュを生成できるAIモデル「DeepMesh」、スマホカメラから実世界の3D空間を理解する大規模言語モデル「SpatialLM-Llama-1B」を取り上げます。
手のひらMacBook爆誕? OPPO Find N5のリモートPCコントロールを試す #スマホ沼
お待たせしました。ポッドキャストTechnoEdge-Sideを休止して以来、ひさしぶりにテクノエッジ編集部のビビッドな内幕を披露する場を毎週設けることにしました。
OpenAIがまたYouTubeライブで発表をしました。今回のモデルはChatGPT 4oと、いささか古いのですが、その画像生成についての進展がテーマです。
2016年のGoogle I/Oで、初のスマートスピーカー「Google Home」と共に発表された「Googleアシスタント」ですが、そろそろお別れの時が来たようです。
GDC 2025で「Roblox(ロブロックス)」がAIを使った新しい機能を披露していました。
Google が、一部 Google マップ利用者のタイムラインデータ(移動履歴)を誤って削除していたことが分かりました。
米カリフォルニア州でオラクルが主催するJavaに関するカンファレンス「JavaOne 2025」が日本時間で2025年3月18日深夜に開幕しました。
生成AIモデルが検索で引用する情報が誤ったものが多いことを指摘した米コロンビア大学のTow Center for Digital Journalismによる2025年3月発表の研究を取り上げます。
カリフォルニア大学バークレー校(UCB)の研究者たちは、小さなリスが不安定な木の枝から枝へと軽やかに飛び移る動きを再現することができる1本足ロボット「Salto」を開発しました。
GoogleがPixelスマートフォンの最新モデル、Pixel 9シリーズの廉価版 Pixel 9a を米国で発表しました。
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第87回)では、声の高さや話す速度も調整可能な高度なテキスト読み上げシステム「Spark-TTS」や、3DビデオゲームをAIがプレイできるようにするフレームワーク「PORTAL」を取り上げます。