http://hayabusa3.2ch.sc/test/read.cgi/news/1437218055/
1: 名無しの司馬遷 2015/07/18(土) 20:14:15.78 ID:rSXHVQNI0●.net BE:342992884-PLT(13000) ポイント特典
sssp://img.2ch.sc/ico/folder1_04.gif
「くずし字」を最新技術で自動解読
7月18日 19時16分

no title


手書きの文字として明治初期まで広く使われていた「くずし字」を、最新の技術を使って自動で解読するシステムを大手印刷会社などが開発し、
古い文書の解読サービスを試験的に始めることになりました。

「くずし字」は筆で書きやすいようにつなげて書く書き文字で、明治の初めごろまでは広く使われていましたが、
今では国文学の研究者などしか読むことができなくなっています。

大手印刷会社などが開発したこのシステムは、くずし字の文章をパソコンに取り込むと文字の切れ目を自動的に検知し、
およそ1万字が登録されたデータベースと照合して、今の文字に変換してくれます。

くずし字は文書ごとに書き手の癖が違うため、あらかじめ人の手で補正する必要がありますが、およそ80%の精度で解読できるということで、
今後データが蓄積されれば、さらに精度が上がるということです。

国内には100万を超える数のくずし字で書かれた文書が残っているとされ、会社では、研究者を対象にした古い文書を解読するサービスを
この夏から試験的に始めるということです。

開発した会社の大澤留次郎係長は「現代人は残念ながらくずし字を読むことができず、昔の人の思いや考えに触れることができなくなった。
このシステムを使って新しい発見をしてほしい」と話していました。

(続く)
http://www3.nhk.or.jp/news/html/20150718/k10010158591000.html

2: 名無しの司馬遷 2015/07/18(土) 20:14:41.62 ID:rSXHVQNI0.net
研究者たちの期待高まる

くずし字を解読する技術。

研究者の中にはこの技術を待ち望んでいた人もいます。

国立極地研究所で15年余りオーロラの研究をしている片岡龍峰准教授です。

過去のオーロラが見られた地域や季節、時間などを分析することで、当時の地磁気の状態などを知ることができるのではと考え、
江戸時代以前の古い文書の研究に興味を持っています。

しかし、こうした文書の多くが「くずし字」で書かれているため、宇宙物理学が専門の片岡さんには読むことができません。

片岡さんは、この技術を使うことで効率よくオーロラの記録を調べられるようになり、新たな発見につながるのではないかと期待しています。

国立極地研究所片岡龍峰准教授は「日本語で書かれているのに文字が読めないというのは非常にもどかしく、研究の障害になっていた。
この技術を使って埋もれているオーロラの記録を見つけ出すことができれば、今後発生するオーロラを予測することに役立つかもしれない」と話していました。

34: 名無しの司馬遷 2015/07/18(土) 22:51:40.97 ID:VzL/QOf+0.net
>>1
あまり分析できてなくてワロタ
でも開発初期でこれは結構凄いかも

4: 名無しの司馬遷 2015/07/18(土) 20:18:17.79 ID:M2KUVyhP0.net
将来的には学者の質を落とすことにならんか?

41: 名無しの司馬遷 2015/07/19(日) 09:31:40.34 ID:f890ysGQ0.net
自分は日本史の研究者だが、時代により違うし人にもよるからな
鎌倉時代の絵巻とか室町時代の僧侶の記録なら比較的簡単に読めるが、幕末・明治期の私信とかは読みにくい

>>4
昔に比べて勉強量減ったという気はしている
現代語訳ついた史料も増えたし
しかし、肝心なことは現代語訳が正しいかを自分で判断することだ
それをやらずに現代語訳を読んで答えだけ書いてくる人が多い

今回のものはあくまで
>現代人は残念ながらくずし字を読むことができず、昔の人の思いや考えに触れることができなくなった
という素人向けで、研究者は一から読んだ方がいい

6: 名無しの司馬遷 2015/07/18(土) 20:23:01.05 ID:rSXHVQNI0.net
そのうち、現代の文字も分からなくなって、ナウシカ(原作)の旧世界の文字を解読するみたいになるんだろうな

7: 名無しの司馬遷 2015/07/18(土) 20:24:24.38 ID:pEa3uaJf0.net
すげえええ
タモリ倶楽部で読める人が出ててかっこよかった

8: 名無しの司馬遷 2015/07/18(土) 20:27:04.61 ID:vGgBLOBQ0.net
学生時代にこれ欲しかった…

9: 名無しの司馬遷 2015/07/18(土) 20:30:53.19 ID:dH8Owx780.net
現代の草書を読む事すら出来ないから読める人は格好いいと思う。
幕末の志士の漢詩をサラッと読めるような人にいつかなりたいもんだ。

10: 名無しの司馬遷 2015/07/18(土) 20:33:18.35 ID:rSXHVQNI0.net
くずし字もそうだけど、文章自体読めないよな
140年前の福澤諭吉の学問のすゝめですら、原文で読むのは大変だろ
60~70年前の本ですら、読みづらいと思う

17: 名無しの司馬遷 2015/07/18(土) 21:49:32.41 ID:UEWRaBIj0.net
>>10
ちょっと教養があれば読める

25: 名無しの司馬遷 2015/07/18(土) 22:21:33.07 ID:Zl9b+FSj0.net
>>17
江戸時代までの平仮名の多さを覚えるか

11: 名無しの司馬遷 2015/07/18(土) 20:37:25.06 ID:2lZf03lh0.net
失われた古代文字

12: 名無しの司馬遷 2015/07/18(土) 20:40:26.03 ID:rWRIosVg0.net
これ使ったとしても書簡の候文とかは無理だろ

13: 名無しの司馬遷 2015/07/18(土) 20:48:36.89 ID:NaZMpo5G0.net
国文学研究者も将来的にこのシステムを使うようになるのだろうか

14: 名無しの司馬遷 2015/07/18(土) 20:54:27.08 ID:NaZMpo5G0.net
江戸初期の慶長三陸地震について
伊達政宗が津波の被害などを手紙に残してたけど
歴史研究者は「また伊達男のいつもの大げさな誇張だろ」と考えてたらしいな

15: 名無しの司馬遷 2015/07/18(土) 20:55:41.23 ID:gA3J7VqR0.net
なんで昔の人はこんな字体使ったんだよ・・・
未来の人の事考えられないかな?

24: 名無しの司馬遷 2015/07/18(土) 22:20:57.38 ID:Zl9b+FSj0.net
>>15
アメリカの筆記体も現代の学生は読め無いよ
ラテン語レベルなんじゃねえの?

16: 名無しの司馬遷 2015/07/18(土) 21:08:12.70 ID:yPJXLf+p0.net
寺子屋では楷書ではなく草書(筆文字)を教えていたので
今とは逆に草書の読み書きができるのに楷書がわからない人が居た。
浮世絵や絵草紙の文字はミミズがのたくっているようで分からないな。

18: 名無しの司馬遷 2015/07/18(土) 22:06:58.70 ID:yM5j7Ysz0.net
1年も死ぬほど古文書読み漁れば読めるようになるよ
学部の頃2年ぐらい徹底的に読まされたら卒業して10年以上経つ今でも
余程の個性的な筆跡でない限り博物館行っても読めるし

19: 名無しの司馬遷 2015/07/18(土) 22:10:34.53 ID:fyUhYIMr0.net
これができるなら、筆跡鑑定も機械でできるんじゃ?

20: 名無しの司馬遷 2015/07/18(土) 22:15:23.26 ID:qHZIXttg0.net
読み漁るというてもモチベが続かないと無理なので、やはりエロの出番ということになる
エロは向学心の基礎にして全てである

さぁ、寄越したまえ。

22: 名無しの司馬遷 2015/07/18(土) 22:18:01.78 ID:eEN6HFtt0.net
日本民族としては、源氏物語より古い変態エロ小説がありそうで怖い

23: 名無しの司馬遷 2015/07/18(土) 22:20:09.80 ID:+tzUkhf90.net
大日本古記録の編纂が捗るな

26: 名無しの司馬遷 2015/07/18(土) 22:25:42.67 ID:FLSizOa90.net
百人一首でさえ、見たことない変な平仮名がいくつもありますもの

27: 名無しの司馬遷 2015/07/18(土) 22:25:43.59 ID:N1sQaKiE0.net
150年前の文章が読めない国も珍しいな。

28: 名無しの司馬遷 2015/07/18(土) 22:27:28.84 ID:XeW+uVFh0.net
前にここでスレ立ってた戦前の手紙すら変体仮名のバリエーションが多すぎて読めなかった

29: 名無しの司馬遷 2015/07/18(土) 22:28:33.77 ID:afhtU11p0.net
さっぽろテレビ塔に開業日の新聞(昭和32年)が貼ってあるんだが、それですら文体に違和感を感じたな。

30: 名無しの司馬遷 2015/07/18(土) 22:28:55.59 ID:4mvI//zF0.net
むしろ、漢文の方が古典は読みやすい
ひらがなだと、独特の崩した文字で分からん

漢文の場合、現代みたいな文字で書かれてるんだよな

32: 名無しの司馬遷 2015/07/18(土) 22:34:58.28 ID:j6cmt2bMO.net
達筆過ぎて読めない上司からの年賀状

33: 名無しの司馬遷 2015/07/18(土) 22:40:24.67 ID:NaZMpo5G0.net
そういやカタカナには異字体とかあったりしたのかな

39: 名無しの司馬遷 2015/07/19(日) 09:18:39.96 ID:QsrLTcZZ0.net
>>33
江戸時代までは字によってはひらがなの書き方はは何種類かあった

36: 名無しの司馬遷 2015/07/19(日) 06:17:32.51 ID:ZfwZWIF00.net
テレビで見たがその宇宙物理学の教授が史料と真剣ににらめっこしたあと
「読めません・・・」ってつぶやいててクソワロタ

37: 名無しの司馬遷 2015/07/19(日) 06:41:38.44 ID:/mtCxvf/0.net
字母=仮名文字の元になる漢字が何かわかれば仮名文字の文学は
読めるようになる。講義で毎週小テストがあった。

古文書学の教授は「毎回資料をよく見ていれば必ず読めます」言うてた。

38: 名無しの司馬遷 2015/07/19(日) 08:48:50.43 ID:ZRT2FAyO0.net
文字はただ読みやすくこそあらまほしけれ

40: 名無しの司馬遷 2015/07/19(日) 09:25:34.22 ID:9NQ7w6Z/0.net
国文だったけど学生の頃は読めた
誰でもわりとすぐ読めるようになると思う

42: 名無しの司馬遷 2015/07/19(日) 11:17:57.92 ID:C7QVwj6i0.net
行書は楷書を少し崩したようなので読みやすいが
草書は元の漢字が古代の篆書隷書を崩したのが多いので読めなくて当然。
変体仮名も同様で読みたいけど勉強しないと無理ゲー。
ラテン語の原書を読むくらいのパワーが必要だろな

45: 名無しの司馬遷 2015/07/19(日) 15:26:31.66 ID:/p9GsreW0.net
崩し字辞典片手に解読するのが楽しいのに
余計な事すんな

44: 名無しの司馬遷 2015/07/19(日) 14:06:54.68 ID:UT/N+vTB0.net
ついでに現代語訳もしてくれ