「AI臭い文章を生成させない」ルール集。LLMに“質の高い技術文書”を書かせるスキルを技術書出版社表が公開(生成AIクローズアップ)

テクノロジー AI
山下(Seamless)

2014年から幅広い分野の研究論文をピックアップして解説しているメディア「Seamless」(シームレス)を個人運営しています。

特集

1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。

今回は、LLM(大規模言語モデル)に日本語の技術文書を書かせたり推敲させたりするためのAI向けの日本語文章規範スキル「japanese-tech-writing」を取り上げます。人間が技術書を書くときのやってはいけない注意事項ではなく、LLMにAIっぽい日本語文章を生成させないための指示書です。

このスキルは技術書出版社であるラムダノートの鹿野桂一郎代表が公開しました。

▲GitHub Gistで公開された、LLM向けの日本語技術文書の文章規範スキル「japanese-tech-writing」のSKILL.mdのスクリーンショット

スキルの内容には、論理的でノイズのない技術文書を生み出すためのエッセンスが詰まっており、次のような章で構成されています。

  • 整形

  • 段落と論証の構成

  • 論証の厳密さ

  • 読み手の負荷の管理

  • 視点と語り

  • 演出の抑制

  • LLMっぽい表現の禁止

  • 冗長の排除

  • 見出しの付け方

  • 読者への誠実さ

このようにルールは多岐にわたり、技術書としての誠実さと読みやすさを担保するための細かな指示が書かれています。

まず文章の見た目や構成について、一文ごとの改行や、本筋から外れる補足事項の脚注化によって可読性を高めるなどの基本が指定されています。段落の構成では、一段落につき一つのトピックだけを配置することや、段落の最初の文を読めば内容が把握できるようにすること、論理が迷走しないよう論証を一方向に進め、結論を言い直す構成にしないことなどが求められます。

論証の厳密さについても、読者からのツッコミどころを残さないよう規定されています。「AだとBになる」という結果だけを書くのではなく、なぜそうなるのかという因果関係のメカニズムを示す必要があります。また、複数の要因が絡む事象を安易に一つの原因に丸め込まないことや、「必ず解決できる」といった誇大な表現を避け、「~が成り立つときに限り」といった条件付きで正確に記述することも求められます。

読者の負荷を下げる工夫もされており、後から参照しないファイル名や関数名といった不要な固有名詞を出さないように指定しています。また、「AI」や「ツール」といった曖昧な言葉でぼかさずに対象を具体的に示すことも書かれています。

他にも、勿体ぶって読者の気を引こうとするなど、LLMがやりがちな、過剰な演出を抑えることも示されています。過剰な太字を控えることや、同じ主張を繰り返さない冗長の排除、見出しの付け方なども書かれています。

LLMっぽい表現の禁止

そして「LLMっぽい表現の禁止」の章では、体裁だけ整って中身の薄い日本語をAIに生成させないための指示が書かれています。

「重要なのは~である」「本章では~を扱う」といった無意味な予告や、「まとめると」「要するに」などの総括は禁じられています。「正面から扱う」「正面から回収する」といった、具体性のない姿勢だけの宣言もNGです。

さらに、「鍵となる」「根本的な」といった主張の中身を伴わない空虚な形容詞や、「深掘りする」「言語化する」といった何をどうしたのかを誤魔化す空虚な動詞も排除対象です。「さらに」「また」「加えて」の連打も制限されています。

根拠なく主張を弱めて安全圏に逃げる弱い緩和(「~と言えるだろう」「~かもしれない」)や、意味のない強調(「非常に」「極めて」)も削ぎ落とされます。

このようにLLMが生成する特有のノイズを排除し、読者が迷わず読めて、かつ論証として崩れない技術書を目指したスキルになっています。


《山下(Seamless)》

Amazon売れ筋ランキング

山下(Seamless)

2014年から幅広い分野の研究論文をピックアップして解説しているメディア「Seamless」(シームレス)を個人運営しています。

特集

BECOME A MEMBER

『テクノエッジ アルファ』会員募集中

最新テック・ガジェット情報コミュニティ『テクノエッジ アルファ』を開設しました。会員専用Discrodサーバ参加権やイベント招待、会員限定コンテンツなど特典多数です。