日記とか、工作記録とか

自分に書けることを何でも書いてゆきます。作った物、買ったもの、コンピュータ系の話題が多くなるかもしれません。

「読めてしまう日本語」の実験

2009年ころに、2ちゃんねる界隈で「読めてしまう日本語」という話題が流行ったことがあります。


その話題では「単語の最初の文字と最後の文字だけを維持して、そのほかの文字の順番を入れ替えてもなんとなく読めてしまう」とされていて、以下のような引用文が掲げられていました。

こんちには みさなん おんげき ですか? わしたは げんき です。
この ぶんょしう は いりぎす の ケブンッリジ だがいく の けゅきんう の けっか
にんんげ は もじ を にしんき する とき その さしいょ と さいご の もさじえ あいてっれば
じばんゅん は めくちちゃゃ でも ちんゃと よめる という けゅきんう に もづいとて
わざと もじの じんばゅん を いかれえて あまりす。
どでうす? ちんゃと よゃちめう でしょ?
ちんゃと よためら はのんう よしろく


最近、これを思い出したので、VisualBasic.netで実際に変換するプログラムを作ってみました。しかし、自分で作ってあれこれ試してみると、「脳内修正機能」は、話題になっていたよりもだいぶ限定された能力のように感じられてきました。


例えば、虚構新聞の以下の記事を例にとってみましょう。

 森永チョコは、チョコレート菓子「DARS(ダース)」の新商品として、同じサイズのチョコレートが144個入った「GROS(グロス)」を今秋にも全国発売する。価格は1500円(税込)。

 93年発売の「ダース」は、「小枝」や「ハイチュウ」と並ぶ同社きってのロングセラー商品。商品名の綴りは異なるが、12粒入りであることからその名がついた。現在ではオリジナルの<ミルク>以外にも<ビター>や<白いダース>など多品目で展開している。

 今回全国発売が決まった「グロス」の内容量は、「ダース」と同じサイズのチョコレート12箱分(計144粒=1グロス)。重さは730グラムで、パッケージサイズは広辞苑程度になる。

 同社では昨年から滋賀県など一部地域で試験的に「グロス」を販売していたが、購入者からは「量が多すぎて食べきれない」「さすがに食べ飽きた」「ぬ~ぼ~が食べたい」など厳しい意見が多かった。同社ではこれらの意見に耳を傾けず、「圧倒的な存在感がおもしろい」として、独断で秋の全国発売に踏み切った。

 今のところ味はミルクチョコレートをベースにした<白いグロス>のみ。本紙記者がその理由について尋ねたところ、広報担当者から「ブラックは和民さんだけで十分なので」との返答があった。


これを私が作った「ひがらなシッャフル(*1)」を使って変換してみたのが以下の文章です。

もなりが チョコ は、 チーョレコト かし 「DRAS ( ダース )」 の しうひょんしん と して、 おなじ サイズ の チレーョコト が 144こ はっいた 「GROS ( グロス )」 を こしんゅう に も ぜこんく はばつい する。 かかく は 1500えん ( ぜこいみ )。

93ねん はつばい の 「ダース」 は、 「こえだ」 や 「ハチイュウ」 と ならぶ どしうゃ きっての ロセラグンー しうひょん。 しょう ひんめい の つづり は ことなる が、 12 つぶ いり で ある こと から その めい が ついた。 げんざい で は オジナリル の < ミルク > いがい に も < ビター > や < しろい ダース > など たんもひく で てんかい して いる。

こかんい ぜんこく はつばい が きっまた 「グロス」 の ないよりょうう は、 「ダース」 と おなじ サイズ の チコーレョト 12はこぶん ( けい144 つぶ = 1ぐろす )。 おもさ は 730ぐらむ で、 パッイーサケジズ は ひろしじ その ていど に なる。

どうしゃ で は さねくん から しけがん など いちぶ ちいき で しんけてき に 「グロス」 を はんばい して いた が、 こゅにううしゃ から は 「りょう が おすおぎて たれなきべい」 「さすが に たきべあた」 「ぬ ~ ぼ ~ が たたべい」 など きびしい いけん が おかおった。 どしうゃ で は これら の いけん に みみ を かむたけず、 「あとてっうき な そいんかざん が おもろしい」 と して、 どだくん で あき の ぜんこく はつばい に ふきっみた。

いま の ところ あじ は ミルーョチクコレト を ベース に した < しろい グロス > のみ。 ほんし きしゃ が その りゆう に ついて たねずた ところ、 こうほう たとんしうゃ から 「ブラック は わたみ さん だけ で じゅうぶん なので」 と の へんとう が あった。


たぶん、これを読んだ皆さんは、脳内修正機能がうまく働かず、意味がつかめなかった部分がいくつもあったと思います。ひとりひとり脳の構造は違うだろうから、人によってはかなりスムーズに読めてしまうのかもしれないけれど、少なくとも私の場合、いろいろ限られた場合にだけ、脳内修正機能は働くようです。私があれこれ試行錯誤したところでは以下のような法則がありそうです。


 例)「チョコレート」 → 「チーョレコト」
 例)「ロングセラー」 → 「ロセラグンー」

 しかしこれは、のばす音やつまる音と、その前の音の組み合わせかもしれません。
 以下の例なら脳内修正されやすいのではないでしょうか。

 例)「チョコレート」 → 「チョレーコト」 ←ちょっとまだ苦しいかも
 例)「ロングセラー」 → 「ロセグンラー」

  • 数値は並べ替えてはならない。意味が変わってしまうだけで脳内修正は不可能。

 例)「2013年」 → 「1320ねん」
 例)「144こ」 → 「414こ」

  • 長い単語(6文字以上?)は脳内修正されにくく、意味が掴めないことが多い。

 8文字ではほとんど意味がわからない。

 もしかすると、8文字の単語は4文字+4文字としてシャッフルすると良いかもしれません。
 あるいは、長い単語には修正が効く文字数(例えば2か所までなら脳内修正できるとか)があるかもしれません。
 例)「ないようりょう」 → 「ないよりょうう」は私の脳では修正が効きそうだ。

  • つまる音は、その前の文字との関係は維持しておけば、脳内修正が効きやすい。

 例)「ちゅうもく」 → 「ちもうゅく」は脳内修正は厳しい感じ。
  「ちゅうもく」 → 「ちゅもうく」なら脳内修正されやすいように感じられます。

  • 同じ文字が2個続くと脳内修正が難しくなる。

 例)「冒頭(ぼうとう)」 → 「ぼとうう」


実は、これをうまく応用していけば、検索エンジンから検知されにくい「意味消失」文章を作れるのではないかなと画策しているのだけど、うまいこと実装に結び付けられていません。人間にはわかるんだけど、コンピュータには理解されにくい文章を実現したいと妄想しており、もうちょっとアイディアを検討中です。


■ おまけ:「ひがらなシッャフル」を使ってみたい方向け

以下のURLに、実行ファイルが置いてあります。
http://backfire.x.fc2.com/Shaffle/HigaranaShaffle.exe

ただし、色々前提とするプログラムがあります。以下のプログラムがインストールされているPCで動作します。

  • 漢字交じりの文章を単語分解するために、Microsoft Word 2010の機能を呼び出しています。
  • 単語を読み仮名変換するために、Microsoft Excel 2010の機能を呼び出しています。
  • .Net Framework 4.5がインストールされている必要もあります。

※インストール要件がめんどくさくて申し訳ないです
※WordやExcelは、もしかするとほかのバージョンがインストールされていても動作するかもしれません。もし動作確認ができた方がいたらコメント頂けるとありがたいです。

VB.NET基礎学習Bible―270例題で学ぶプログラミングの散歩道

VB.NET基礎学習Bible―270例題で学ぶプログラミングの散歩道