ChatGPTの機能を使い、「自分向けの推敲支援機能」を作ってみた。
Google共同創業者のサーゲイ・ブリンさんが久しぶりに登場し、AIなどについて語りました。
ASUSが定番ゲーミングノート ROG Zephyrus G16 / G14の2024年モデル、G16 GU605 / G14 GA403シリーズを国内で発売しました。
NHK大河ドラマ「光る君に」を楽しんで視聴しています。紫式部と清少納言が初めて出会ったときのバチバチ感はスリリングでした。
ChatGPTがこれほど広く雑多な目的に適用できるのは未だ驚きです。このままいわゆるAGIに到達する道にあるのか、規制や資源の問題はどうなるのか、未来への関心は尽きませんが目の前の実用も重要です。
今週も、生成AIの重要論文5本を解説します。透明含む複数レイヤーを同時に画像生成できるAI「LayerDiffuse」、音楽を文字のように扱う音楽生成AI「ChatMusician」など。
Google CloudとStack Overflowは戦略提携を発表しました。両社は最新AIモデルのGeminiとStack Overflowのナレッジを統合したサービスをそれぞれのプラットフォームで提供する予定です。
インタビューの中で勝手に次のシングルについて語っていたので、その曲をAIに作ってもらいましたが、余計な詳細を語っていたので苦労したという話。
生涯のパートナーとなる人とはどうしたら会えるのか。現在の日本では、結婚に至った人の4分の1近くがマッチングアプリを経由したものだという統計があります。
裸眼立体視ディスプレイをコンパクトにしたLooking Glass Goがついにユーザーの元に届きます。それに備えて、単眼深度推定を行うための方法をまとめました。
Samsungは2月28日、業界初となる256GBのSD Expressに対応したmicroSDのサンプル出荷を開始したと発表しました。
SunoがV3 Alphaになって作曲能力が想像を超えてきたので、ちょっと面白い試みをしてみました。架空のロックバンドによる架空のコンセプトアルバムを作ってみるというものです。
前回標準のWorkflowにLoRAを追加してみたが、今回は画像が出来た後、つまり後処理用のNodeを追加してみたい。
今回は、なぜおじさんをAIで生成するのか、そこから何を得たいのか、その理由について語ります。
AI作曲サービスのSunoのバージョン2を大幅に改良したバージョン3(V3)のアルファ版が、有償プランであるProとPremiumユーザー向けに提供開始されたので試してみました。
今週の生成AIウィークリーは、AIの“パラメータ”を生成するAI「P-diff」、過去最高精度のリアルタイム物体検出器「YOLOv9」など重要論文5本を解説します。
Googleは2月21日(現地時間)、Google WorkspaceユーザーがGmailやドキュメント、スライド、スプレッドシート、MeetでGeminiを利用できるGemini for Google Workspaceの提供を開始しました。
Googleの生成AIであるGeminiが、多様性に配慮するあまり「1943年のドイツ軍兵士の画像を作って」に対してナチスドイツ風軍装の黒人男性やアジア人女性の画像を生成してしまい、Googleは歴史的に不正確だったと認める声明を発表するできごとがありました。
マイクロソフトがWindowsやOfficeに生成AIアシスタントCopilotを組み込み、Googleも独自AIのBard改めGeminiで検索からGmail・カレンダー・マップ等々をこれまでになく使いやすくすると宣言する状況に、従来からAIに注力してきたAdobe が黙っているわけはありません。
デザイナーのマット・ウェッブ氏は先週木曜日、天の川銀河の中心を矢印で指し示す、無料のiPhone向けARアプリ『Galactic Compass』をApp Storeに公開しました。
CES 2024報告会&テクノエッジ新年会を開催しました。
AIを用いることでファイルの種類を高速かつ正確に判別できるツール「Magika」をGoogleがオープンソースで公開。
人気連載「生成AIグラビアをグラビアカメラマンが作るとどうなる?」の著者である西川和久さんを講師に迎えた、生成AIグラビアワークショップの第4回を1月23日に開催いたします。なお、今回お申し込みいただいた方は、第3回分の動画アーカイブを視聴いただけます。
GoogleのAIはBardからGeminiに変わりました。名前以外にどこが変わったのかをまとめてみました。
1週間分の生成AI関連論文の中から重要なものをピックアップする連載。今回は、Gemini 1.5、LoRA改良版、WindowsのAIエージェント、長時間動画にも対応するマルチモーダルAIなど5本を紹介します。
シンガポールのAIデバイス企業 Brilliant Labs が、メガネ型端末「Frame」を発表しました。
OpenAIから新しい動画生成モデル「Sora」が発表され、合わせて技術レポートも公開されました。Soraはテキストから最長1分の動画を生成できるモデルで、画像から動画の生成や動画の補完も可能。作例を見る限り、現在公開されているどの動画生成モデルよりも優れています。
Slackは2月14日(現地時間)、2023年に予告していた生成AI機能「Slack AI」の一般提供を米国と英国にて開始したと発表しました。
グラビアカメラマンでありソフトウェアエンジニアでもある西川和久氏による生成AI
グラビア実践講座 第18回をお届けします
複数の同一人物を同時に量産できるNVIDIAの画像生成AI「ConsiStory」、Gemini UltraやGPT-4に匹敵する数学特化のオープンソース言語モデル「DeepSeekMath」などを解説します。
Midjourneyは今後1年間、同社の人工知能ソフトウェアを使って政治的な画像を作成すること、特にジョー・バイデン氏とドナルド・トランプ氏の画像生成を禁止することを検討しています。
米Googleのスンダー・ピチャイCEOは、同社の有料クラウドストレージサービス「Google One」の加入者が1億人を突破したことを発表しました。
Googleは新開発したAIモデルの最高峰「Gemini Ultra」の提供を開始しました。また、対話型AIサービスの名前を「Bard」から「Gemini」に変更します。
アップルの研究者らが、入力した文章によって画像を編集できるAIモデル「MGIE」を発表、公開しました。MGIEとはMLLM-Guided Image Editingの略で、テキストベースのコマンドを解釈するマルチモーダル大規模言語モデル(MLLM)を使用しています。
Microsoftは2月7日(現地時間)、AIを搭載した新しいBing検索(現在のCopilot)の提供開始から1周年を記念し、Copilotのアップデートを発表しました。
米Amazonは2月2日(現地時間)、ショッピング向けのAIアシスタント「Rufus」を発表しました。米国でAmazonのモバイルアプリを利用する一部ユーザーに対してベータ版が提供開始されており、今後数週間のうちに米国のさらに多くのユーザーに展開されるとのことです。
iPhone 15 Proで0.2秒以内に高品質な512×512画像を生成することにGoogleが成功。生成AIに関する最新論文5本を解説します。
生成AIによりおじさんの画像を作り出すためのツールや生成のコツのようなものをご紹介します。
GoogleのチャットAIサービスBardで、日本語でもGemini Proを利用可能になりました。
アップルが未発表製品に関して言及することは、厳しい秘密主義のためか滅多にありません。
サムスンの最新フラッグシップ・スマートフォンGalaxy S24シリーズでは、生成AIの「Galaxy AI」が大きなセールスポイントとなっています。
Mac雑誌の創刊を経験したことのある、それなりに長いMacとの関わりを持つ筆者が、Macの40年を個人的な関わりから振り返ります。