あたらしい ことばって 何だろう?

あたらしいことば(≒未知語)の多くはカタカナ語です


上のグラフはRANK(使用頻度)ごとに その語が 既知であるか(辞書やwikipediaに収載されているか)か 未知であるかを示したものです

  1. 既知: 一般辞書 --- EDICTに収載されている語 (http://www.csse.monash.edu.au/~jwb/j_edict.html)
  2. 既知: 固有名詞辞書 --- ENAMED-DICTに収載されている語 (http://www.csse.monash.edu.au/~jwb/j_edict.html)
  3. 既知: WIKIPEDIA --- Wikipediaに収載されている語(2007年)
  4. 未知: 数字/アルファベット --- 数字,アルファベットやアルファベット (例)2007, U-TOKYO
  5. 未知: カタカナ --- カタカナ語列
  6. 未知: それ以外 --- 上記以外
赤い部分がそうであるように 未知語のほとんどはカタカナ語です
ではどんな語が未知なのでしょうか?

未知語の多くは 「モス」や「ナマサプリ」のような 固有名詞であるようです
これらの多くは「〜する」をつけて 「モスする」といった用言化する性質をもっています



カタカナ語用言のおよその意味をとらえる

そこで カタカナ語用言のおよその意味をとらえることに挑戦しています
現在は 場所/道具 である固有名詞について そこそこ わかってきました

  • たとえば 【ミスドする】=ドーナツを買うこと などです
      ↓何かいれてみてください



    All rights reserved eiji.aramaki@gmail.com 2009 | Designed by: Technology Directory
  • 発表

      セミナー

    1. 「Google n-gramデータによる新語の意味解析」 GSKセミナー: Web日本語Nグラムの利用, 2008 (10月31日, 東京工業大学).