きらめきの行方

彼らはどこへ向かうのだろう

スタミュ in 品詞分解!!(という名のキャラソン歌詞分析・前哨戦)

2015年10月期に放送されたTVアニメ『スタミュ』に登場するキャラソンの歌詞を、大学の授業のレポート課題として品詞分解して分析した、というだけのエントリです。ご存知の方もそうでない方も、もしよろしければそのままお読みください。(ちなみに今回のタイトルはDVD・Blu-rayの特典ドラマCDのタイトルに準じています)

続きを読む

文明の利器も何とやら

Wi-Fiが無いと何もできないなあと思うきょうこの頃。実はいろいろとあって、いま現在わたしの家では常時Wi-Fiが繋がらない状態なんです。とても不便。不便ったらありゃしない。

 

Wi-Fiが無いと何が起こるかというと、スマホの速度制限との戦いです。パソコンでの調べ物はできなくなるので、4G回線が繋がるスマホでしか調べ物ができなくなります。となると、キャリア会社による速度制限との戦いの火蓋が切って落とされるわけです。これがめちゃくちゃ大変でして……まだ12/8なのに半分近く使ってるんです……先月初めて速度制限がかかった際の遠出はもう地獄みたいでした。ゲームもTwitterもLINEも、何もかもが遅い。家では基本的にWi-Fiを使っていたおかげで速度制限を免れられていた、ということにようやく気づきました。Wi-Fi様々だった……戻ってきてWi-Fi……

 

そういうわけで、特にデータ通信量を食う動画とゲームは控えています。見たいものとかやりたいものとか山ほどあるんですけどね……かなしい……レポートも毎日のように学館にノーパソを持参してカタカタやっています。この現状、早くどうにかならないかな_(:3 」∠)_

 

ほんとうはきょう品詞分解結果をここに出したかったんですけど、量が膨大なのでパソコンからやるしかないなあと思って諦めました。明日出します。たぶん。

1%の直感と99%の勢い

お題「ブログ名・ハンドル名の由来」

 

由来……由来かあ、どっちも割とすんなり考えてしまったので、由来という由来はあるようで無いんですけどね。響きの問題というかなんというか。

続きを読む

文字の海に溺れる

こんばんは。きょうもきょうとてわたしは品詞分解の結果と戦っています。カウントすること自体の終わりは見えてる気がするんですけどね〜〜ただ、言葉を見てるとどうしても脳内がゲシュタルト崩壊を始めるので、いまも自分が打っている文章を脳のどこかが勝手に品詞分解を始めています。落ち着け。それかせめて夜に寝てくれ。

 

 

前々から迷っていた複合動詞と慣用句の扱いは、どちらも1語ずつでカウントすると決まったので、とりあえずはどうにかなりそうな予感がします。が。

 

 

連体詞ってなんぞや。

(まあよくよく考えれば「この」が指示代名詞なわけはないことはわかるんですけどね。疲れてたのかな)

 

明鏡国語辞典』によると、

活用のない自立語で、もっぱら体言を修飾するもの。

(中略)『この』『ある』『ほんの』『あらゆる』などの類

らしいんですが……ダメだ頭が……この辺のくだりは高校受験を控えた中学3年生のほうが詳しそうです。自立語とか体言とか完全に忘れてるし、正直言って中学の教科書が読みたいなあ、と思ったけどさすがに実家にあるわ。読めない。しょうがない、きちんと明日調べよう。

 

実は品詞カウントよりも危ないのがレポートの論の組み立てだったりするんですけど、それはもうどうにかするしかない。卒論じゃないんだし、勢いだ勢い。明後日先生から返却される第1稿の添削内容が気になるところですが、頑張ろうと思います。文字の海に溺れる前に生還できたらいいなあ(品詞にはすでに溺れているのでもう手遅れ)

レポートのはずなのに蘇る自己採点の記憶:「KH Coder」によるテキストマイニングを試してみた

レポートのために歌詞の品詞分解を全手動で完了させたわたしですが、先日「テキストマイニング」という方法を知ったので、実験と確認を兼ねてきょうはフリーソフトの「KH Coder」を試してみました。

 

感想:結構簡単だった

瞬殺でした。ものの数秒ですべてが品詞分解されていました。

どうなのかなあと思っていた造語も事前に指定しておけばきちんと数えてくれるし(最初「ストライド」が名詞として認識されなくて動詞の「スる」と名詞の「トライ」に分かれてたのには笑いましたが)、すごく優秀なソフトでした。作った方すごい。

品詞分解とカウントと並べ替えにかかったわたしの28.7時間はいったい……と思いましたが、普遍的な単語のカウントは案外ミスっていなかったので、いまは割とポジティブな気持ちです。よかった。ほんとうによかった。

 

蘇る自己採点の記憶

そういえば、KH Coderで抽出した語句のリストはExcel形式で出力できるんですけど、それを見てセンター試験翌日の自己採点のことを思い出しました。

センター試験の翌日というと、みんなで学校で自己採点をする日なんですけど、そうは言ってもだいたいのひとが試験2日目の夜に終わらせちゃってるんですよね。わたしの当時の某クラスメイトもそのひとりだったんですが、このひとのやった自己採点が当時のわたしには特異な方法だったなあと。その方法が、

 

  • 某予備校が出している解答速報のExcelデータをダウンロード
  • 自分の解答を入力したら正誤判定するように関数を組む
  • Excel上で自己採点

 

というものだったんですが、そのExcelデータを見せながらきらきらとした目で話していた様子が、きょうの抽出語句のリストによって思い出されました。懐かしい。

 

単純にわたしが普段Excelに触れなさ過ぎてきょうのことをきっかけに思い出したってだけなんですけどね。ちなみにこのひと、半年後ぐらいにハガキで届く実際の得点と自己採点の結果が1点の誤差も無かったらしいです。機械ってすごい。

 

終わりに

思い出話はこのくらいにしておいて……どうしても品詞の分類に関しては自分とソフトとで食い違いが起きてしまっているので、そこの擦り合わせさえどうにかできれば精度が向上しそうな予感がします。何かちょっと終わりが見えてきた感じがしてとても嬉しいです。品詞分解さえ完成してしまえば論を組み立てられる……わけではないんですが、これが大きな一歩であることには間違いなさそうです。やったぜ。

はあ、きょう明日でデータをきちんと整理できたらいいなあ。がんばろうっと。