
ChatGPTの媚びすぎ問題、利用者の「いいね」等に過剰反応が原因。GPT-4oモデル巻き戻しで対応、複数の個性から選択式へ
最近のChatGPTが過度にユーザーを褒め称えたり、回答の正しさよりも迎合を優先すると批判が高まっていた件について。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第47回:HiDream-I1-Full/Devをローカル生成+α(西川和久)
HiDream-I1-FullとDevの違いは!?

OpenAI、ChatGPTが未成年ユーザの猥談相手になってしまう「バグ」を修正へ
OpenAIは、ChatGPTが18歳未満の未成年ユーザーとのチャットで性的に露骨な画像を生成したり、NFSWな会話を展開するのを制限するための修正を「積極的に行っている」と述べています。

ついにやってきた日本人対話型ポッドキャスト量産システム。NotebookLM使えばなんでもポッドキャストになる(CloseBox)
Google NotebookLMには、PDF、テキスト、YouTubeなどを読み込んで、その内容についてリアルな対話ポッドキャスト解説を生成する機能があります。2024年9月11日にローンチした時点では英語でしか使えなかったのですが、4月30日、ついに日本語対応しました。

驚異のオープンソース動画生成AI「FramePack」がMacでも使える。Vidu Q1とFramePack叡智の合わせ技も試した(CloseBox)
動画生成AIで、今回は3つの大きなニュースがあります。そのうち2つは前回お伝えした驚異的なオープンソース動画生成AI「FramePack」に関すること。

GitHubリポジトリを読み取り、ドキュメントを自動生成するAIツール「DeepWiki」がログイン不要、無料で使える(生成AIクローズアップ)
1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。今回は、GitHub上のリポジトリを自動的に解析し、ドキュメントを生成してくれるオープンソースAIツール「DeepWiki」を取り上げます。

モトローラのアゲアゲのパーティに参加するも、とにかくrazr 60を触りまくってきた話(スマホ沼)
モトローラのrazr 60シリーズ発表会に参加後、ニューヨークのイベントで自由に試せる機会があり、カメラ性能やmoto aiの充実を実感しました。また、ココ・ジョーンズのミニライブもありました。

“1分の生成映像でも破綻しにくくする”動画AI向け強化技術「FramePack」の原理、AIと人間の声を区別できるか600人以上で実験など生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第92回)では、ByteDanceが発表した2つのモデル、動画生成AI「Seaweed-7B」とGPT-4o超えという画像生成AI「Seedream 3.0」を取り上げます。

AI検索のPerplexityもGoogleからChrome事業が分割なら「喜んで買収する」と名乗り
米司法省のGoogleに対する反トラスト法裁判に、証人として出廷したPerplexityの幹部、ドミトリー・シェベレンコ氏は、GoogleからChrome事業が分割されれば、喜んで買収を申し出るだろうと述べています。

FramePackがAI動画の長さ制限を取り払った。では次の課題は何か? 4分間のAI動画を自分のPCで一発生成して気づいたこと(CloseBox)
4月18日に登場した、驚異的な動画生成AI「FramePack」。自宅のWindowsマシンにインストールして以来、RTX 4090で生成し続けています。最大2分間の一発生成も数回試してみて、わかったことがあります。

AIに「逆転裁判」をプレイさせ、推論能力が一番高かったのはどのLLM?(生成AIクローズアップ)
1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。今回は、AIモデルに「逆転裁判」をプレイさせて推論能力を調査した内容を取り上げます。

1分超えたいなら動画生成はローカルAIを選べ。6GB VRAMでも動くオープンソースAI「FramePack」の実力は本物か、試してみた(CloseBox)
本日2本目のAI記事。ControlNet、WebUI Forge、Fooocusなど、画像生成AIソフトに多大な貢献をしてきたlllyasvielさんが、動画生成AIの新しいオープンソースソフト「FramePack」を公開しました。NVIDIA GPU専用ですが、WindowsとLinuxですぐに使えます。

複雑なキャラの高品質なSVG画像を生成するAI「OmniSVG」、異なる写真同士を合体生成する「UNO」など生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第91回)では、複数の写真に写る被写体を1枚の写真に統合させる画像生成AI「UNO」や、1枚の写真から音声に応じた話す人物映像を作成するトーキングヘッド生成AI「FantasyTalking」を取り上げます。
![生成AIグラビアをグラビアカメラマンが作るとどうなる?第46回:遂にオープンでFLUX.1 [dev]を超える!? HiDream-I1登場(西川和久) 画像](/imgs/p/I7E-tRhECAmbEbuwokhjFw2aqJSmlZSTkpGQ/24799.jpg)
生成AIグラビアをグラビアカメラマンが作るとどうなる?第46回:遂にオープンでFLUX.1 [dev]を超える!? HiDream-I1登場(西川和久)
オープンで高性能のHiDream-I1(サービス利用編)

まるで映画「ブレードランナー」のあのシーン。古い写真の撮影場所をChatGPT o3が12分かけて特定したそのやり方がすごい(CloseBox)
OpenAIのChatGPT o3とo4-mini、o4-mini-highが投入されてすぐに試したのは、o3による音楽解析でした。その日のうちにもう1つ、試してみたので今回はそちらをご報告します。それは、写真分析です。

ChatGPT o3は耳コピもできるってよ。AIで作った曲の分析・改善提案からコードの採譜まで可能に(CloseBox)
OpenAIがChatGPTのLLM(大規模言語モデル)の新モデル、o3とo4-mini、o4-mini、o4-mini-highを公開しました。現在ではPlus、Pro、Teamユーザーが使えます。

AIは人間に不信感を抱いてる? AIが人間の本質をどのように捉えているかを調査した研究(生成AIクローズアップ)
今回は、大規模言語モデル(LLM)が人間の本質をどのように捉えているかを調査した論文「Measurement of LLM’s Philosophies of Human Nature」を取り上げます。

Googleの最先端動画生成AI「Veo 2」がGemini Advancedでロールアウト。そして偽サイトには騙されないように(CloseBox)
一部ユーザーにのみ開放され、それ以外の人はウェイティングリストに登録するだけ……そんな状態が続いていたGoogleの動画生成AIサービス「Veo 2」が、Gemini Advancedでロールアウト開始しました。

最強カメラフォンを発表するvivoの写真展へ行ってきた(スマホ沼)
vivoは「vivo X200 Ultra」を発表予定で、ユーザーによる写真展を開催。深センの地下鉄駅で自然と都市のエコロジーを表現し、さまざまなカメラフォンの作品を展示しました。

AIグラビアからヴァイブコーディングまで、生成AIの最新動向を解説するテクノエッジ主催イベントを5月20日、開催します
テクノエッジ編集部は、AIグラビア、ゲームAI、音楽・動画AI、そしてヴァイブ・コーディングなど、生成AIの最新動向を解説するイベントを5月20日19時から開催します。

カメラバーよ、さらば。Pixel 9aは『買い』か? Proと比較して見えた実力(Google Tales)
3月19日に発表された後、発売日がしばらく発表されずにどきどきしていた「Pixel 9a」が、日本では4月9日に発売されました。 今回のGoogle Talesは、ずっとハイエンドのPixelシリーズをメインに使っているユーザーによるファーストインプレッションです。

歩行者信号ボタンを押すとマスクやトランプのAI音声で風刺メッセージ流れる。シリコンバレーでハッキング被害
先週金曜日、シリコンバレー周辺の一部の横断歩道で、歩行者横断用のボタンを押すと信号待ちの間にイーロン・マスク氏やドナルド・トランプ大統領、マーク・ザッカーバーグ氏らのAI音声による小話が聞けるようになりました。地元紙Palo Alto Onlineによると、これは何者かが歩行者用ボタンをハッキングしたために起こった事案であるようです。

XのGrok 3に画像をプロンプトで加工できるEdit Imageがやってきた。ChatGPTより制限ゆるめだがその実力は?(CloseBox)
Xに搭載されているLLM(大規模言語モデル)のGrok(現在はGrok 3 beta)に、Edit Imageという画像編集機能が追加されました。

アニメ主人公になりきり好きなシーンを生成しながら無限に遊べるゲームAI「AnimeGamer」、写真内の人物を映像化できる「DreamActor-M1」など生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第90回)では、写真内の人物をテキスト指示に応じたアニメーション映像を生成する動画AI「DreamActor-M1」や、テキストから映画級の人物映像を生成できる動画AI「MoCha」をご紹介します。

ChatGPTが全チャット履歴を参照できるようになったので、今後の活動方針を相談してみた(CloseBox)
OpenAIはChatGPTの過去のチャット履歴全てを参照できるオプションの提供を始めました。

Google Cloudが「Agent Development Kit」をオープンソースで公開へ。MCPもサポート
Google Cloudは、日本時間で今日(2025年4月10日)未明に開幕した「Google Cloud Next 2025」において、AIエージェントの開発を容易にするフレームワーク「Agent Development Kit」をオープンソースとして公開することを発表しました。

Google提唱のAIエージェントプロトコルA2Aは汎用魔法Telescriptの夢を見るか(CloseBox)
GoogleがA2A Protocolを発表しました。最近注目されているAIエージェントを複数動作させる場合の標準プロトコルを提唱するというものですが、これを見て、「30年前のあの技術の再発明か」と思ったのは私だけではないようです。

速さは正義。最高水準の動画AI「Runway Gen-4 Turbo」が10秒を1分で生成するようになったので、ミュージックビデオを作り直しました(CloseBox)
きのう完成させたばかりのミュージックビデオが早くも作り直しです。Take 2を公開しました。どうしてそうなったかというと、現在メインで使っている動画生成AIサービスのRunway Gen-4に新しく高速モードが登場したからです。

1枚の画像からAIで曲を作り、ミュージックビデオを完成させるAI制作ワークフローを解説します(CloseBox)
最近、曲を作りました。AIで。そのワークフローがいろいろなAIツールを少しずつ使っていく、ちょっと面白いものだったので、その流れを紹介しつつ、最近のAIツールについて紹介していければと思います。

完全無料のヴァイブコーディングAI「DeepSite」誕生。アイデアを文章入力→ブラウザ上でゲームが数分で生成、プレイ可能(生成AIクローズアップ)
今回は、アイデアを自然言語で入力するだけでブラウザ上でゲームやWebサイトを生成できる完全無料でオープンソースなヴァイブコーディングAI「DeepSite」を取り上げます。

動画生成AI、ついに25秒に到達。PikaはSoraを超えたのか?(CloseBox)
AI動画生成を「25秒まで生成できます」「5フレーム分の画像から生成できます」というところが現れました。それがPikaです。

Midjourney V7のドラフトモードがAI画像生成のゲームチェンジャーに。音声の追加指示を高速に反映(CloseBox)
今回は別の記事を書いていたのですが、Midjourneyの新バージョンであるV7を試してみたらすごいことになっていたので急遽切り替えて、こちらをレポートすることにしました。

ChatGPT AI音声とおしゃべりしたら「まったくやる気が湧かないですね」「何か文句でも」との答えにどんよりした(CloseBox)
米国時間の4月1日、Mondayという新しいAIボイスがChatGPTに登場しました。

Apple Intelligenceが日本で使えるようになってよかったなと実感した瞬間(CloseBox)
4月1日、iPhone、iPad、Mac、Apple Watch、そしてVision Proまでが一斉にアップデートされました。この大型アップデート最大のポイントは、日本でApple Intelligenceが使えるようになったことです。

自律AIらが書いた論文を利用して研究を繰り返し続ける「AgentRxiv」、リアルタイム動作する対話可能な実写3DアバターAI「TaoAvatar」など生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第89回)では、リアルタイムで動作する対話可能なAI搭載実写3Dアバターを生成できる技術「TaoAvatar」、テキストや映像などを認識しながら同時にテキストや音声応答できるAIモデル「Qwen2.5-Omni」を取り上げます。
![生成AIグラビアをグラビアカメラマンが作るとどうなる?第45回:FLUX.1 [dev]より高性能!?Reve Image登場+α(西川和久) 画像](/imgs/p/I7E-tRhECAmbEbuwokhjFw2aqJSmlZSTkpGQ/24237.jpg)
生成AIグラビアをグラビアカメラマンが作るとどうなる?第45回:FLUX.1 [dev]より高性能!?Reve Image登場+α(西川和久)
いきなり登場したReve Image。当たると「え?これデジイチで撮った写真!?」的な画像が生成され、明らかにFLUX.1 [dev]を超えている。

主要AIモデルはどれも“歯が立たない”、新しい「人間には簡単だがAIには難しいAGI問題」登場(生成AIクローズアップ)
今回は、AGI(汎用人工知能)の進歩を測定するために設計された新しいベンチマークテスト「ARC-AGI-2」が登場し、最先端のAIモデルが挑戦した、その結果報告を取り上げます。

ローカル生成AIのためのマシンって、今ならこんな感じ?(CloseBox)
Xでローカル生成AIのためのマシンはこんなのがいいんじゃないか?と投稿してみたのですが、予想外に反響があったので、ChatGPT deep researchを使ってまとめてみました。

スマホカメラから実世界の3D空間を理解するLLM「SpatialLM」、静止画像を3Dビデオに変換する「Stable Virtual Camera」など生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第88回)では、高解像度な3Dメッシュを生成できるAIモデル「DeepMesh」、スマホカメラから実世界の3D空間を理解する大規模言語モデル「SpatialLM-Llama-1B」を取り上げます。

テクノエッジ公開編集会議、やってます。毎週水曜日夜9時から
お待たせしました。ポッドキャストTechnoEdge-Sideを休止して以来、ひさしぶりにテクノエッジ編集部のビビッドな内幕を披露する場を毎週設けることにしました。

ChatGPT 4oの画像生成でテキスト能力が上がったらしいので、手書き文字からロゴを生成してみた(CloseBox)
OpenAIがまたYouTubeライブで発表をしました。今回のモデルはChatGPT 4oと、いささか古いのですが、その画像生成についての進展がテーマです。

「すみません、よくわかりません」から卒業? GoogleアシスタントがGeminiに(Google Tales)
2016年のGoogle I/Oで、初のスマートスピーカー「Google Home」と共に発表された「Googleアシスタント」ですが、そろそろお別れの時が来たようです。
- 693件中 1 - 42 件を表示
- 次へ