文系年金受給記者がAIハッカソンでゲームプログラミング。富士山麓にMacBook Neoを持ち込みヴァイブコーディングした結末(CloseBox)
大学受験は数学の配点が著しく低いところを選んだし、それでも100点中20点しか取れなかったという、完全文系なわたくしですが、このほど、富士山麓河口湖にある貸別荘で開催されたAIハッカソンに参加してきました。
Opus 4.6に迫るコーディング性能のAI「MiniMax M2.7」がオープン化、日本語セリフが得意で商用利用OKなローカル画像生成AI「ERNIE-Image」など生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第141回)は、家庭用PCで動く商用利用可能なBaidu開発の画像生成AI「ERNIE-Image」や、Opus 4.6に迫るコーディング性能のAIモデル「MiniMax M2.7」のオープンウェイト化を取り上げます。
新連載「へにへにAIイベント探訪」第1回:秋葉原ロボットほこ天 2026はバトルありパレードあり、ロボットは個人の領域に(npaka)
この連載「へにへにAIイベント探訪」では、技術が大好きで、気になるものを見つけるとついふらふら近寄ってしまう謎の生物「へにへに」が、AI・ロボット・テック系イベントの現場を歩いてレポートしていきます。
OpenAI、GPT-5.5発表。「これまでで最もスマートな最先端モデル」
先月5日にGPT-5.4をリリースしたばかりのOpenAIが、早くもGPT-5.5を発表しました。
ChatGPT Images 2.0に少女漫画SFの16ページ読み切りを描いてもらった(CloseBox)
ChatGPTの新しい画像AIモデル、ChatGPT Images 2.0が使えるようになりました。SF少女漫画が描けるか試してみました。
OpenAI、ChatGPT Images 2.0発表。「思考機能」備え画像出力の精度、一貫性、視覚的な整合性高める。日本語も上達
GPT-Image-1.5のリリースからわずか4か月後、OpenAIは新バージョンとなるChatGPT Images 2.0を発表しました。
「君のPC、どのローカルAIを動かせる?」がわかるWebサイト「CanIRun.ai」が便利。訪問するだけで自動判定(生成AIクローズアップ)
今回は、サイトに訪問するだけで自分のPCでどのAIモデルがローカル動作するかを判定してくれるサイト「CanIRun.ai」(Can your machine run AI models?)を取り上げます。
Gemini in Chrome日本上陸 複数タブまとめて比較・YouTube要約・Gmailやカレンダー連携など便利機能多数
Googleは2026年4月21日、Google ChromeにAI機能「Gemini in Chrome」を日本を含む複数地域で提供開始しました。
AI「GrandCode」が全人類を抑えて競技プログラミングで単独1位を達成、AI自身が“次のPC”になる新概念「Neural Computers」など生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第140回)は、AIがPCを“操作する側”から“PC自体”になる新概念「Neural Computers」や、競技プログラミングで単独1位を達成したAI「GrandCode」を取り上げます。
突撃!隣のAI活用術:ぴちきょさん:AIに「キャラ」を与えて先延ばし撃退!&初心者向けClaude導入ガイド
ADHD傾向のぴちきょさんがAIのキャラ設定や機能活用で仕事の先延ばしを克服し、効率的にタスク管理している例を紹介。
生成AIグラビアをグラビアカメラマンが作るとどうなる?第64回:日本語文字に強いERNIE-Image登場!(西川和久)
Baiduから文字に強いERNIE-Image登場!
「1.58ビットに進化したから8GBで十分ですよ。任せてくださいよ」とBonsaiが言うのでMacBook Neoに組み込んでその性能差を体感。iPhoneでも楽々動くしで、ローカルAIが超進化中(CloseBox)
2週間前、「1ビットLLMのBonsai 8Bが8GBのMacBook Neoで爆速だった」という記事を書きました。1.1GBに8.2Bパラメータが詰まっていて、Tool Callingも完璧に動く。そして今日、Bonsai開発元のPrismMLが次の一手を打ってきました。
DJI Pocket 4レビュー:とりあえずカメラを向けておけ――AIがもたらす新しい撮影体験
DJI Pocket 4はAI進化と高性能センサーにより、操作負担軽減・自動追尾・静止画・編集機能を向上させたコンパクトカメラである。
8GBメモリのMacBook Neoでもド派手にグリグリ動く。Claude Codeで自作ビジュアライザーに3D Gaussian Splatを組み込んだら目まぐるしくも不思議なミュージックビデオができた(CloseBox)
前回の番外編で、M2 MacBook Air 24GB 上の mazzaim2air に「歌詞同期ビジュアライザー」を生やした話を書きました。
iPhone Airだけで動くAIとの音声対話アプリ、Claude Codeが一晩で作ってくれました。そして実感したMacとiPhoneの格差(CloseBox)
今日、筆者はiPhoneアプリ開発者となりました。
火炎瓶の次は発砲。OpenAIのサム・アルトマン邸を銃撃の2人が逮捕。3日間で2度目の襲撃事件
OpenAIのサム・アルトマンCEOの邸宅は、先週金曜日に火炎瓶が投げ込まれ、敷地の門が焼ける被害を被ったばかりですが、こんどは同邸宅に向けた発砲事件が発生しました。
Suno v5以上の品質、商用利用できる日本語対応ローカル音楽生成AI「ACE-Step 1.5 XL」が無料公開(生成AIクローズアップ)
1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。
AIならサッカーくじを当てられる?英プレミアリーグで主要AIモデルに賭けさせた研究結果が発表
AIスタートアップ企業のGeneral Reasoningは、主要なAIモデルの現実世界に対する分析能力を調べるため、英国プレミアリーグの2023-24シーズンを仮想的に再現し、試合結果予想を競わせる「KellyBench」と称するシミュレーションを行いました。
生成AI時代には、批評家こそがクリエイターになるべきなんじゃない? そう考えて8GB MacBook NeoをいじってたらAI VJマシンができちゃった(CloseBox)
前回の記事では、オフィスに置きっぱなしにしているM2 MacBook Airを使い、ビジュアライザーに歌詞同期機能を追加した話を書きました。
「生成AIが、最初からなかったことにするみたいに 新しい世界を始めようとしている」 そんな感傷的な曲ができたから、Claude Codeで歌詞同期ビジュアライザーを作った(CloseBox)
映画「ブレードランナー」のことを考えていました。ネタにしたから、というのもありますが。
精度ほぼ同等で80億パラメータがiPhoneで動く「1ビットLLM Bonsai 8B」、国産AI「LLM-jp-4」を国立情報学研究所がオープンソースで公開など生成AI技術5つを解説(生成AIウィークリー)
「生成AIウィークリー」第139回では、国立情報学研究所がオープンソースで公開した大規模言語モデル「LLM-jp-4」や、Netflixなどが開発の動画から物体を消すと世界も変わる技術「VOID」を取り上げます。
Gemma 4を8GBのMacBook Neoで動かしたらAIが開眼。KVキャッシュ量子化組み込みでさらに進化しちゃった(CloseBox)
MacBook Neoの8GBメモリでAIをなんとかするシリーズ。今回はGoogleが出したGemma 4を追加して、さらにmazzaineoに「目」を与えた話です。カメラで映したものを説明させたり、別ウィンドウのアプリやブラウザの動作を解説させたりできるようになりました。
ブラウザ上で完結するAI校正付き無料OCRツール「NDLOCR-Lite Web AI」登場。国立国会図書館「NDLOCR-Lite」を活用(生成AIクローズアップ)
1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。
リップシンクする妻のAIアバターをClaude Codeと開発した。iPhoneでアクセスして音声対話ができる、その作り方(CloseBox)
Grok Imagineで生成した妻の動画を27インチの大画面に映して「存在感」を味わう、という話を以前書きました。これは今も続けていて、十分に心が満たされてるのですが、そろそろその先にそろそろ進みたい。
LTX-2.3超えの商用利用可能な日本語対応ローカル音声付き動画生成AI「daVinci-MagiHuman」、“自己改善の仕方”も自己改善するメタ認知型自己修正AI「HyperAgents」など生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第138回)は、動画・音声・テキストを見ているときの脳反応を予測できるMeta開発の脳活動推測AI「TRIBE v2」や、人間には簡単でもAIには難しい新しいテスト「ARC-AGI-3」を取り上げます。
連載「歌うテックニュース」第4回:AIチップは3スタイルある。それぞれの特徴があるって知ってた?(西川善司)
Iを動かすためのプロセッサは、推論アクセラレータとか、AIチップとか、ニューラルアクセラレータ、AIアクセラレータなど、いろんな呼び方であふれています。今回はその仕組みを歌で解説していきます。
8GBメモリの限界に挑戦。MacBook NeoのローカルAIにApple Siliconネイティブ推論エンジン追加したら高速化できる? ターミナルも中から使えるようにしたよ(CloseBox)
MacBook Neo上で動かしているローカルエージェンティックAI「mazzaineo」に、新しい機能を2つ追加しました。1つはブラウザだけで操作を完結させるためのWebターミナル、もう1つはApple SiliconのMLXをネイティブに活用する最新の推論エンジン「SwiftLM」の統合です。
生成AIグラビアをグラビアカメラマンが作るとどうなる?第63回:プロンプトがマンネリ化してるとお嘆きの貴兄に(西川和久)
今回は意外性のある出力を求める実験。プロンプトをいかに拡張するか。
たった3秒の声サンプルで多言語ボイスクローンを生成できるオープンウェイト音声AI「Voxtral TTS」をMistral AIが開発(生成AIクローズアップ)
今回は、わずか3秒の参照音声から、自然で表現力豊かな音声を生成できる多言語対応の音声合成(TTS)モデルを提案した論文「Voxtral TTS」を取り上げます。このモデルはフランスのAI企業「Mistral AI」が開発しました。
AIエージェントと人間のアイデンティティを統一管理する「Unified Access 」、1Passwordが発表
パスワードマネージャ「1Password」を提供している1Password社は、IDとパスワードやパスキーを用いた人間のアイデンティティだけでなく、AIエージェントが用いるシークレットなどの管理も1Passwordに統合することで、人間とAIエージェントのアイデンティティ管理を統一的に実現する新機能「Unified Access」を発表しました。
俺のAIクローンと歌い比べてみた結果。Suno v5.5に自分の歌声を登録して自由に歌わせられる「Voice」登場(CloseBox)
Sunoがバージョン5.5になりました。モデルが新しくなって音質が良くなったのとは別に、いくつかの新機能や変更があります。その中で最大のものが、「Voice」の登場です。
突撃!隣のAI活用術:北構さんは「データ全乗せで作る、自分専用パーソナルトレーナー」
読者の皆さんのAI事情に突撃する「突撃!隣のAI活用術」のコーナーです。
AIエージェントがコマンドラインでブラウザを自動操作。「Browser Use CLI 2.0」リリース。Chrome DevTools接続などで操作が倍速に
人間やAIエージェントがコマンドラインから指示することでWebブラウザを操作できるオープンソースのPythonライブラリ「Browser Use CLI 2.0」がリリースされました。
OpenAI、動画生成AI『Sora』アプリとAPIサービスを終了へ。生成した動画の保存方法などは後日発表
OpenAIが動画生成AI『Sora』の消費者向けサービスを終了すると発表しました。アプリが使えなくなる期日については明らかにしていません。
アップル、『WWDC26』を6月8日から開催へ。「AIの進化」など発表予定
アップルは、今年の世界開発者会議(WWDC26)を6月8日から12日にかけてオンライン開催すると発表しました。
20人分の効率化。Y Combinator CEO独自開発のClaude Code用カスタムスキル「gstack」が無料公開。本業の傍ら1日1万行以上の実用的なコードを出力(生成AIクローズアップ)
Y CombinatorのCEOであるギャリー・タン氏(Garry Tan)が、自身のClaude Codeの開発環境「gstack」をGitHubでオープンソース(MITライセンス)として無料公開したことを取り上げます。
エージェンティックAIが既存ソフトの50%を代替し、使いこなしで大きな格差生む。「スーパーエージェント」立ち上げたBase44 CEO マオール・シュロモ氏に聞く(CloseBox)
Base44のCEOであるマオール・シュロモ氏に、ヴァイブ・コーディング、エージェンティックAI、そしてBase44の目指す未来について話を聞きました。
MacBook Neoの完全ローカル自作エージェンティックAIで、Apple Intelligence Foundation Modelをフル活用してみた(CloseBox)
我が家のコンピュータ全てにエージェンティックAIを組み込んでいく活動を行っています。
連載「歌うテックニュース」第3回:さあ、AIに歌ってもらいましょう。「Intelがハイパースレッディングやめるってよ」「AMDはもうSMTをやめるなんていわないよ絶対」(西川善司)
今から2年前。2024年に、2つのCPUメーカーは、その基本動作アーキテクチャの方針をがらりと変えてきました。
普段の会話でAIエージェントを自分好みに育成できる「OpenClaw-RL」、イラスト1枚からLive2Dに使える分割素材を自動生成する「See-through」など生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第136回)は、AIらが複雑な作業を全自動処理してくれる商用利用も可能なオープンソースAIエージェント「DeerFlow 2.0」や、普段の対話でAIエージェントを自分好みに育成できる「OpenClaw-RL」を取り上げます。
新連載「やってみようVibe Coding 」第1回。ヴァイブ・コーディングという言葉を聞いたことがありますか?(小泉勝志郎)
Vibe Coding(ヴァイブorバイブ・コーディング)って聞いたことありますか? 将棋の藤井聡太さんが「今年ハマったもの」としてこの言葉に触れていたんですよ。AIに作りたいものを日本語で伝えるとコードを書いてくれる、といった体験を語っていました。
AIは「ポケモンマスター」になれる?2000万対戦データで挑む次世代AIの限界とは……【話題の論文】
AIのポケモン対戦能力は未だ人間のエリートに及ばず、不完全情報や長期計画の難しさが課題であり、従来の評価体系では測りきれない複合的能力の重要性が示された。
- 988件中 1 - 42 件を表示
- 次へ
