orangeitems’s diary

クラウドで働くインフラエンジニアの日々の感想です(ほぼ毎日更新)。



選挙開票になぜAI OCRを導入しないのか理解できない

f:id:orangeitems:20190723211254j:plain

 

人力による開票はもう限界だ

もう、人力による開票はお金がかかるうえに人間独特の誤りを排除できず、限界ではないでしょうか。

 

www.jiji.com

静岡県富士宮市選挙管理委員会は23日、参院選比例代表で自民党の山田太郎氏が同市内で得た515票の全てを、れいわ新選組の山本太郎代表の票として扱うミスがあったと発表した。市民からの指摘で発覚した。当落への影響はないという。

 

人間が行う以上、見間違いや思い込みによる誤検知があるということをまざまざと教えてくれた事例となりました。

電子投票についてはまだ準備が整っていないことはわかりますが、開票自体はもはや機械化すべきではないでしょうか。

今、特にRPAの世界でAI OCRという技術が発達しているのをご存知でしょうか。手書き文字を自動認識し読み取ることができるのです。

今回は、そのAI OCR技術を特集します。

 

AI OCR事例

 

2019/7/4 ITmedia

japan.zdnet.com

 特に注目されているのがAI-OCRによる紙帳票のデータ化と入力業務の自動化である。OCR(光文字認識)にAI技術を取り入れることで、従来型と異なり、文字枠(ピッチ)のない、自由記入方式の手書き文字を読み取れるようになる。漢字やカタカナ、数字、英字などの混在や印影の重なりなどにも対応できるほか、帳票レイアウトを事前に設定しなくても、AIが読み取り箇所を自動で抽出するといったことも可能になる。

 NTTデータは、LGWAN(行政専用閉域ネットワーク)を活用したAI-OCRサービスを地方公共団体向けに提供している。手書きの各種申請書類をスキャンした画像ファイルをLGWAN経由でAI-OCRサービスにアップロードするだけで、自動変換されたテキストデータをCSV形式で取得できるものだ。これにRPAツールを組み合わせることにより、基幹システムへのデータ入力までを自動化する。

 

2019/7/19 Ledge.ai

ledge.ai

しかし株式会社Cogent Labsの手書き文字認識AI OCR『Tegaki』の導入で、採寸データの入力作業が溜まることは一切なくなったという。

Tegakiとは手書き書類をスキャンして取り込むだけで簡単にデータ化して保存ができる手書きAI OCRサービス。自動認識が難しかった手書き文字を高速・高精度に読み取ることができる。各種申込書類やアンケートをはじめ、医療機関での問診票など様々な手書き書類の読み取りに対応可能。手書き文字の認識率99.22%を達成した研究結果を元に、データ入力業務の効率化とコスト削減を実現する。

 

2019/6/27 BD

bitdays.jp

■LINE BRAIN OCR
国際会議で世界最高水準の認識精度を誇る「画像内の文字や文章をテキストデータへ変換する技術」です。写真やスキャンした印刷文字、スクリーンショット内の文字を精度高く認識します。「LINE BRAIN OCR」は、ICDARでAI競合他社を抑え4分野で世界No.1を獲得しています(2019.03.29時点)。例えば、申込書・注文書・請求書などの登録、領収書の日付・品目・金額などの読み取り、免許証などの身分証の登録(eKYC)などに活用が期待できます。

 

2019/7/6 ニュースイッチ

newswitch.jp

さらに、AI―光学式文字読み取り装置(OCR)とRPAの連携は、実用化が目前に迫る。NTTデータではLGWAN(行政専用閉域ネットワーク)を活用し、自治体が保有する大量の紙帳票を基幹システムに登録する「AI―OCRソリューション」を10月に発売する予定だ。

 

2019/1/28 IT Leaders

it.impressbm.co.jp

Smart Data Entryは、手書き帳票からのデータ入力をAIを用いて支援するクラウドサービスである。クラウド上でAI-OCRを動作させ、複合機から入力した手書き帳票をテキスト化する。手書き帳票の受付からテキスト化処理、人による確認と訂正からデータ出力まで、手書き帳票の一連の処理を支援する。電子化した紙文書を一元管理するソフト「DocuWorks」と組み合わせて動作する。

 

考察

その他、ここに紹介しきれない事例もたくさんあり、AI OCRはすでに日本社会に導入され実用レベルに達している技術です。

もちろん100%の識字率はできないものの、判断できないものだけを人間が処理するだけで明らかに開票の正確性が向上すると思います。

特に、山田と山本を間違えるなんてことは、AI OCRは絶対に起こりえないのです。

選挙の結果について、私は大変疑問を持ちました。人間のミスで票数が変わるのならば、そのエラー率はどれぐらいあるのでしょうか。またそれを利用して恣意的に結果が捻じ曲げられた可能性はないのでしょうか。

今回も、市民の指摘が無ければ気が付けなかったのです。

なぜすでにある技術を使わないのでしょうか。電子投票にハードルがあるのなら、せめて開票の大部分を自動化すべきではないでしょうか。

人間がやるから正確、もうすでに、思い込みの領域に入っていませんか?