マルソリ・ラボ
言語学、音声学、日本語、韓国語など。
200705<<123456789101112131415161718192021222324252627282930>>200707
スポンサーサイト
上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

統計ソフトRを使ってみる
最近,週1回のペースで開講されているRの講習を受けています。1ヶ月(計4回)だけの短期の講習です。

Rは統計ソフトです。SPSSやSASのように個人で買うには高いソフトと違って,Rは無料でダウンロードできます。

無料のソフトというと馬鹿にする人がいるのですが,ソフトウェアの世界においては,無料のものというのは結構あなどれません。音響分析におけるPraatにしてもそうですが,ときとして高価なソフトよりも優れた面を持っていることがあります。Rというのは,統計においてまさにそのような存在のようです。というか,Praatよりもはるかにスケールが大きく,有名なプロジェクトのようです。

どうして無料のものがそんなに優れた機能を持ちうるのかというと,オープンソースの利点が生かされているからでしょう。PraatもRも,オープンソースのソフトウェアです。

ただ,Rはけっこう敷居の高いソフトのようです。そう思われるのは,1つには,コマンドを入力することによって作業を進めるタイプのソフトだからです。何でもマウスでクリックして実行するというタイプのソフトしか使ったことのない人にとっては,慣れるまでたいへんだろうと思います。

もう1つ,こちらがより本質的な点ですが,Rを使いこなすには,統計学をきちんと理解していることが要求されるのかもしれません。まだRをよく知らないので何とも言えませんが,そんな印象を受けます。

いちど敷居を越えてしまえば使い勝手がいいのでしょうが,そこまでが大変だろうと予想されます。私が今後その敷居を越えることができるか・・・それは,まだわかりません。1点目はまあいいとしても,問題は2点目です。(おそらく多くの言語学者・音声学者がそうだと思いますが)私の統計学に対する理解はかなり断片的です。この際,きちんと統計学を勉強するというのも,1つの手かも知れませんが,なかなかそうする余裕が・・・。

ということで,この先私がはたしてRに慣れていけるかどうか・・・。もしかしたら,早々にSPSSに戻ってしまうかもしれませんし。というか,SPSSもまだ使いこなせていないですし。




なお,以下のサイトがRの総本山です。ダウンロードも,このサイトからリンクされているミラーサイトから出来ます。
The R Project for Statistical Computing


日本語で情報を得るには,以下のサイトがいいと思います。情報量が豊富です。特に,ここで公開されている「Rによるデータ解析」というPDFファイルはすごいです。
Rによる統計処理(青木繁伸氏)
スポンサーサイト

図が意味すること ― ソウルの発音と慶尚道の発音
先ほど示した図について,誤解のないように少し補足を。

韓国語を多少知っている人であれば音声記号からわかると思いますが,ここで示したのは韓国語のピッチ(音の高低…要するに,アクセントとかイントネーションのこと)です。"마늘 먹는다고 했다."を2通りの発音の仕方で発音してもらった場合について,"마늘 먹는다고"の部分だけを切り出してみて示しています。

でも,これを見て,「へー,韓国語のピッチってこうなんだー」と単純に理解しないでください。確かに韓国語ではありますが,これは慶尚南道の方言の場合です。ソウルの人の発音は,ピッチに関して言えば,これと全く異なります。

ソウルの場合にどうなるかは,というと…
いろいろなバリエーションが考えられますが,ありがちなパターンとしては,おそらく,
마늘:低→高  먹는다고:低→高→低→高
のようになるでしょう。そして,먹는다고の第2音節の高に関して,2通りの曲線でその高さに大きな違いが見られるでしょう。
それと,ソウルは慶尚道ほど高低の落差が極端ではないでしょう。

この文を実際にソウルの人に発音してもらってみたわけではありませんが,だいたい予測できます。どうしてそんなことがわかるのか気になる方は,ぜひ最近出版された『韓国語教育論講座第1巻』を購入なさって,私の執筆した箇所(の特に後半)を読んでいただければ,その一端が理解できるかも・・・なんて,こんなところでも宣伝をしてみたりなんかして。(なお,私の書いた箇所はともかくとしても,韓国語を学問的に扱う者にとって,この本は全体としてとても価値が高いと思います。執筆者に加えていただけただけでも光栄だ,というのが正直なところです。)

前の記事では,図の内容が重要ではなく,作り方を示したかっただけなのですが,内容が気になる人もいるかもと思って,ちょっとだけ補足してみました。

テーマ:韓国語 - ジャンル:学問・文化・芸術

MetaPostでグラフをつくる
前回の図につづき,今度はMetaPostで時間を正規化したF0曲線を作ってみました。以下に示すのがその図です。下のGIFファイルはたいして綺麗じゃありませんが,もとのEPSファイルはかなり綺麗です。なお,時間軸の正規化については,以前の記事に書きました。

MetaPostで作った図(時間を正規化したF0曲線)


おおもとのMPファイルは:ここにおきました。
追記[2007年9月15日]:移動しました。新しい置き場はこちら

利用したのは,グラフを作るパッケージ。マニュアルは以下からダウンロードできます。
MetaPost Publications > CSTR 164

グラフを作ることのできるソフトがたくさんある中,わざわざMetaPostを使ったのは,IPA(国際音声記号)を,綺麗にかつ正確な位置に出したかったからです。(以前は,Excelで作った図をペイントブラシに移し,文字を一つ一つ貼り付けたりしてました。)でも,MetaPostでここまで完成させるまで,かなり苦労しました。まだ,それぞれのIPAの記号が縦方向に微妙にずれてしまうのが気に入らないのですが,うまくいきません。とりあえずはこれで我慢しようと思っていますが,たぶん解決する方法もあるんでしょうね…。
[MetaPostでグラフをつくる]の続きを読む
MetaPostでピッチの模式図をつくる
論文やポスターに載せるピッチの模式図をどう作ろうかと試行錯誤を重ねています。といっても,読者の方にはどういうものか想像がつかないかもしれないので,先に今のところの完成形を示しておきましょう。


ピッチの模式図(サンプル)



今まではだいたい,WordやPower Pointのオートシェイプを利用して,これに似たようなものを作っていました。でも,もうちょっと学問的に正確なものにしたいと思って。

こういうことは,Adobe Illustratorとか使ったらうまくできるのかもしれませんが,持っていないですし,買うと高いですし。学内で利用できるところもあるみたいですが,使えるところが限られていますし。

それで今使っているのは,MetaPostです。MetaPostというのは,「TeXでよく使われるコマンド型の描画ツール」(奥村 2004)です。

[改訂3版]LATEX 2ε美文書作成入門 [改訂3版]LATEX 2ε美文書作成入門
奥村 晴彦 (2004/01/28)
技術評論社

この商品の詳細を見る

(↑私が持っているのはこの第3版ですが,昨年第4版が出たようです。
[改訂第4版] LaTeX2ε美文書作成入門 / 奥村 晴彦

TeX/LaTeXが好きではない人にとっては,MetaPostも好きにはなれないだろうと思います。また,TeX/LaTeXをやったことのない人にとっては,とても敷居が高いだろうと思います。実際,以下のやり方はLaTeXで読み込んで変換するという作業を伴うので,LaTeXをやったことのない方には,いきなりは難しいだろうと思います。

私は実は,博士論文でもMetaPostを使っていました。そのときはLaTeXのコマンドをうまく埋め込めなかったのですが,今回はそれができた分だけ,かなりの進歩です。

さて,ここから先は上の図の作り方。基本的には自分自身のための覚書なので,説明はあまり詳しくしません。(というか,できません。)なお,以下はUNIXでやりました。Windowsのコマンドプロンプトを使ってもほぼ同じだろうと思いますが,もしかしたら違う部分があるかもしれません。

MetaPostプログラムを作る



以下のようなプログラムを作りました。


verbatimtex
%&latex
¥documentclass{article}
¥begin{document}
etex;
beginfig(-1);
u=20bp; v=20bp; w=20bp;
z1=(u,v); z2=(2.5u,0); z5=(5u,0.25v); z6=(6u,0);
draw z1--z2--z5--z6;
label(btex $¥sigma$ etex, (u, v+w));
label(btex $¥sigma$ etex, (2u, v+w));
label(btex $¥sigma$ etex, (3u, v+w));
label(btex $¥sigma$ etex, (4u, v+w));
label(btex $¥sigma$ etex, (5u, v+w));
label(btex $¥sigma$ etex, (6u, v+w));
label(btex ¥# etex, (2.5u, v+w));
label(btex H* etex, (u, v+0.5w));
label(btex +L etex, (2u, v+0.5w));
label(btex H* etex, (5u, v+0.5w));
label(btex +L etex, (6u, v+0.5w));
endfig;
verbatimtex
¥end{document}
etex;
end.


 



これを,foo.mpというファイル名で保存。(.mpの前の部分は別になんでもかまいません。)

次に,コマンドプロンプト上で
mpost foo

と打ち込みます。すると,foo.psというファイルができます。

【参考】
奥村 (2002: 313-316)
TeX Wiki: MetaPost

LaTeXに取り込む


次に,これをLaTeXに取り込みます。以下のように入力したファイルを作ります。


¥documentclass{article}
¥usepackage[dvips]{graphicx}
¥pagestyle{empty}
¥begin{document}
¥includegraphics{foo.ps}
¥end{document}


 



これを,例えばfoo.texのようにして保存します。

次に,コマンドプロンプト上で以下のように打ち込みます。


latex foo
dvips -Ppdf -E foo -o foo.eps


これでEPSファイルができあがり。

あとは,出来上がったファイルを,WordやPower Pointに貼り付けるだけです。

【参考】
奥村 (2002: 316)
TeX Wiki: MetaPost

おまけ:GIFに変換



上のようにこのブログに貼り付けるには,EPSのままでは出来ず,GIFに変換する必要がありました。そのやり方は…

Ghostscriptを利用します。コマンドプロンプト上で以下のように入力。


gs -q -dNOPAUSE -dBATCH -sDEVICE=ppm -sOutputFile=- -r200x200 foo.eps | pnmcrop | ppmtogif >foo.gif


-r200x200の部分は解像度。やや高めにしてあります。pnpcropでは,まわりの余白を切るということをしています。

これで出来上がりです。

やれやれ…。


【参考】
TeX Wiki: Ghostscript


もうひとつ採択
以前のブログに書いたように,先日ICPhSのポスター発表に採択されたのですが,今日は別の発表の審査結果が届きました。こちらは,同じICPhSのサテライト・ミーティング。無事採択されました。こちらもやはり,ポスター発表です。

ICPhS 2007 Satellite Meeting: Workshop on “Intonational Phonology: Understudied or Fieldwork Languages”

上のページには,早くもスケジュールが公開されています。日本語や韓国語の方言について発表する人がもっといるかと思いましたが,私と五十嵐さんだけみたいです。

進歩?
昨日,ここエディンバラ大学の研究会で発表をしました。来たばかりのときに一度発表したので,今回が2度目の発表です。

前回の発表のときは,質問がよく聞き取れずに苦労したのですが,今回はいちおう(完璧にとは言わないまでも)理解できて,ある程度かみあった議論ができたと思います。英語が上達したからなのか,それとも質問が簡単だったからか,あるいはたまたま早口で質問する人がいなかったからなのか。

ところで,質疑応答をしながら感じたことですが,どの部分にひっかかるかは母語や専門とする言語によってかなり違ってくるんですね。私は日本語が母語で,研究上の関心は日本語と韓国語の韻律にあるわけですが,そんな私にとって当たり前のことや予想通りの結果は,こちらの人たちにとっては必ずしも当たり前ではないわけです。そういう部分を丁寧に説明していかないと,どんなに優れた研究でも適切な評価を得られないのでしょう。逆に,何が西洋人に対してインパクトを与えうるかを理解していれば,国際的な舞台で良い評価を得やすいのかもしれません。

今回のネタで後日学会発表をするのですが,もうちょっとうまくアピールできる発表になるよう,工夫する必要がありそうです。それと,英語ももう少しなんとかしないと。コミュニケーション能力が足りないと,なかなか議論が深まっていきません。

まあ何はともあれ,1つ仕事をやり終えて,今はほっと一安心といったところです。

copyright © 2004-2005 Powered By FC2ブログ allrights reserved.
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。