1. HOME
  2. 朝日新聞の校閲部門の蓄積×AIで精度の高い文章校正

朝日新聞の校閲部門の蓄積×AIで精度の高い文章校正

Sponsored by 朝日新聞社 公開日:
「Typoless」開発者の倉井敬史さん(写真左)と校閲記者の比留間直和さん

[聞き手]関根 和弘(GLOBE+編集長)

40年間の膨大な記事データのほかに、校正履歴データを学習したAI

――Typolessは、朝日新聞社の校閲部門の知見と、AIという最新のテクノロジーを結集した文章校正AIですね。

倉井敬史 はい。Typolessは、AI、朝日新聞の用語のルール、そしてユーザー側のカスタム辞書が設定できる構成になっています。

AIには正しい日本語を学ばせる必要があるわけですが、朝日新聞社には過去40年分の記事がデジタル化されたものがあり、その膨大な記事データを学習させました。

さらには、どういう文章の誤りをどう直したのかという校正履歴のデータがあります。完成した記事だけでなく、その校正・編集履歴を学習させることで、AIが誤りの指摘をできるようになるのです。そのおかげで、校正に特化した、精度の高いAIになっています。

社内では日々記事が蓄積されていくので、AIは定期的なアップデートの中で新しい用語にも対応できるようになります。

また、朝日新聞で使っているルールに基づいた辞書データ、実際に記者が使っている校正支援システムというものがあります。そのルール辞書が搭載されていて、誤りやすい日本語・漢字・慣用句・専門用語など約10万個が登録されています。

AIと朝日新聞の辞書、2系統でチェックできるのがTypolessの特長です。

Typolessの開発について説明する倉井さん

――さらにユーザー側でカスタマイズできると聞きました。

倉井 はい。Typolessはカスタム辞書が設定できます。会社によって表記のルールは違いますよね。企業ごとの用語集、音引(おんび)きの有無やカタカナ表記などのルールをカスタム辞書に設定すれば、社内で統一した文書をつくることができます。(※カスタム辞書はプレミアムコース以上の機能になります。)

――ユーザーが入力した文章もAI学習に使われるのですか?

倉井 いいえ、セキュリティー上、AIの学習には用いていません。入力された文章はサーバーに残らないように設計していますので、そこは安心して使っていただければと思います。

――Typolessには朝日新聞の校正支援システムや校閲記者たちの知見が盛り込まれているということですが、校閲記者とはどんな仕事なんでしょうか。

比留間直和 新聞は「ファクト・事実」と「論」を伝えるメディアです。新聞の校閲部門は、まずはその事実やデータに誤りがないかを点検します。二つ目は、正しい、適切な日本語になっているかというところのチェックです。誤字脱字、間違いや矛盾、意味が通らないところがないかというところを見ます。その際に、間違いではないけれども、朝日新聞社内の表記のルールに合っているかもチェックします。スタイルをそろえると、読みやすい文章になりますので。

それから、人を傷つける表現や差別表現、人権を侵害するような文章になっていないかも点検します。この部分は画一的なルールがあるわけではありません。この言葉を使わなければ大丈夫だというものではありませんので、議論しながら進めていきます。

ほかにも、間違いではないけれど分かりにくい、ここにこのようなデータがあれば分かりやすいのではなどといった提案もします。あとは、記事を書く人と見出しをつける人が違う分業ですので、記事と見出しの矛盾がないか、全体の整合性も見ます。

つまり、このままこの商品が出てOKか? というところを見る役割です。よく言うのは、「新聞の校閲は最終関門であり、最初の読者である」ということですね。

――校閲が指摘するものには、どんな例が多いのでしょうか。

比留間 記者が手書きで原稿を書き、鉛の活字を一つ一つ拾っていた時代には、物理的に似た文字を拾ってしまうことや、上下がひっくり返っているなどの誤りが主でした。入力方法がパソコンに変わり、いまでは記者自身が入力するので、なんと言っても多いのは変換ミスです。

「この漢字はもしかしてこっちじゃないですか?」という指摘が一番多い。校閲記者は変換ミスと戦っています。変換ミスは新聞に限らず、漢字を使う限りは起きてしまうものですね。

赤鉛筆での校閲作業の様子を比留間さんに見せてもらった

――新聞における表記のルールは時代によっても変わりますね。

比留間 差別用語やジェンダーの表現なども時代に合わせてルール化してきましたし、最近でしたら例えばウクライナの首都の表記が「キエフ」から「キーウ」に変わりました。このように時代や環境に合わせてルールを決めるのが、いま私が務めている用語幹事の仕事です。

そのように積み重ねてきた表記のルールをまとめてガイドブックにしたものが『朝日新聞の用語の手引』、社内では通称「赤本」と呼ばれるものです。この赤本づくりの事務局も用語幹事の仕事です。

Typolessとの共同作業で文章をつくる

――新聞社などのマスメディアに限らず、最近ではダイバーシティーやインクルージョンへの配慮はどの企業でも求められています。その点もTypolessは指摘してくれるのですね。

倉井 ルール辞書の中に例えば、「父母会→保護者会」や「キーマン→キーパーソン」のように、最近では言い換えた方がいいような表現が登録されています。加えて、「炎上リスクチェッカー」という機能があります。偏見や差別、攻撃的な表現が含まれている場合にAIが指摘してくれるのです。

比留間 複雑なことがらが絡むもので、文脈によってはそのままでよい場合もあるでしょう。「正しい日本語かどうか」などとは違い、最後の判断をするのは人間ですから。

ただ、朝日新聞はこれまで、差別的な表現にならないよう、用語のルールを拡充してきました。また「この言葉はどうあるべきか?」ということを日常的に議論しているのが、校閲部門です。

その経験や知見が積み重なって、あるものは社内の共通認識になったり、あるものは用語のルールになったりしてきました。

ネットやSNS上では、議論が激しくなって結局お互いを遮断して終わりという光景がよく見られます。しかし、意見はそれぞれだとしても、この議論についてどういう観点があるのかということを共有できれば、そこから相手を尊重する表現に変えていけるのだと思います。

倉井 Typolessの指摘が常に正しい、というわけではありませんが、一つのストッパーとして、そこで一度立ち止まって、もっと適切な表現がないか考えてみる。そういう付き合い方をしていただければと思います。

「言葉は社会のインフラで財産」だと話す比留間さん

――Typolessを利用している方からは、どんなフィードバックがありますか。

倉井 レスポンスの速さや、恥ずかしい間違いを手元でチェックできることがうれしいというお客様は多いです。意外だったのは、朝日新聞のルール辞書には同音異義語などについて、言葉の使い方のTips(ヒント、コツ)が出てくるんですが、最近はGoogle検索ではなくTypolessで勉強するといった方もいました。

比留間 校閲記者としては、そこはぜひ本物の辞書を引いて欲しいんですが……。

倉井 最後はもちろん辞書を引いて欲しいですけど、Typolessの良いところは実際に文章のなかで使いながら調べられるということですよね(笑)。

いろんな場面でTypolessを使って欲しいという倉井さん(左)と比留間さん

――どのような場面で使って欲しいと思いますか。

倉井 Typolessはベースが新聞記事であるところから、フォーマルな書き言葉に特化されていると言えます。なので、ビジネスで書く様々な文章には使えますよね。広報、IR、経営企画のように、対外的に文章を書くところ、特にオウンドメディアを運用されている方からのご利用が多いです。校正に割く時間や人的リソースが足りないところで、Typolessが良いソリューションとなっているようです。

開発者としては、全社員が使えるようにしていただけるとありがたいですね。APIといって、社内のシステムとつなげるプランもあります。稟議書や議事録などの精度も上がりますから。

比留間 AI校正の良いところは、見落としが少ないということだと思います。校閲作業をしていて感じるのは、人間の場合、想定している誤りは見つけやすいんですが、想定していなかった新しい間違いや、まれな間違いはやはり見つけにくいんです。

もちろん、すぐれたレシピで大量生産できても、おいしいかどうか、その最後の微妙なジャッジを下すのは人間です。文章も同じ。そしてTypolessは、人間の仕事を支えるための強力なツールです。AIとの共同作業で、よりよい文章づくりが可能になると思います。