あたらしいことば(≒未知語)の多くはカタカナ語です
上のグラフはRANK(使用頻度)ごとに その語が 既知であるか(辞書やwikipediaに収載されているか)か 未知であるかを示したものです
- 既知: 一般辞書 --- EDICTに収載されている語 (http://www.csse.monash.edu.au/~jwb/j_edict.html)
- 既知: 固有名詞辞書 --- ENAMED-DICTに収載されている語 (http://www.csse.monash.edu.au/~jwb/j_edict.html)
- 既知: WIKIPEDIA --- Wikipediaに収載されている語(2007年)
- 未知: 数字/アルファベット --- 数字,アルファベットやアルファベット (例)2007, U-TOKYO
- 未知: カタカナ --- カタカナ語列
- 未知: それ以外 --- 上記以外
赤い部分がそうであるように 未知語のほとんどはカタカナ語です
ではどんな語が未知なのでしょうか?
未知語の多くは 「モス」や「ナマサプリ」のような 固有名詞であるようです
これらの多くは「〜する」をつけて 「モスする」といった用言化する性質をもっています
カタカナ語用言のおよその意味をとらえる
そこで カタカナ語用言のおよその意味をとらえることに挑戦しています
現在は 場所/道具 である固有名詞について そこそこ わかってきました
たとえば 【ミスドする】=ドーナツを買うこと などです
All rights reserved eiji.aramaki@gmail.com 2009 | Designed by: Technology Directory
発表
セミナー
-
「Google n-gramデータによる新語の意味解析」 GSKセミナー: Web日本語Nグラムの利用, 2008 (10月31日, 東京工業大学).