備忘録

Invalid byte 1 of 1-byte UTF-8 sequence

Play frameworkで作ったプロジェクトをnetbeansifyしてNetBeansで作業してたところ、以下のエラーが出てプロジェクトが読み込めなくなった。 Invalid byte 1 of 1-byte UTF-8 sequence どうやら以下のファイルがUTF-8でないことが原因らしい。 プロジェクト…

sedコマンドで半角英数を全角英数に置換する.

半角英数を全角英数に置換する. sedコマンドを使う.hoge1.csvの半角英数を全角英数に置換し,hoge2.csvに出力する. $ sed 'y/abcdefghihklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ1234567890/abcdefghijklmnopqrstuvwxyzAB…

WindowsからMac OS X Lionにデータを転送する.

Mac側の設定 システム環境設定の共有からリモートログインを有効にする. ifconfigコマンドでIPを取得. コンピュータ名を忘れたときはwhoamiコマンドでコンピュータ名を取得. Windows側の(FileZillaを用いた)設定 FileZillaでMacに接続する設定を以下の…

ディレクトリ内の文書データをすべてUTF-8に変換

Windowsで作ったcsvデータをUbuntuで開くとき,文字コードの変換が必要.そんなとき,Ubuntuでnkfコマンドを使えば良い. インストール sudo apt-get install nkf 最近のUbuntuはインストールされてないコマンドが入力されるとインストールを促す賢い機能が…

ライブラリを使わずにJavaからRを使う

統計解析器RをJavaで使う。 RをJavaで扱うライブラリもあるようだけど、 ライブラリの中を理解するのが大変そうなので、 ライブラリを使わずにRの出力をJavaで受け取りたい。というわけで、やってみた。 環境 Ubuntu 10.04 Netbeans 6.8 コード help()コマン…

VertualBoxでWindows7(Host)とUbuntu10.04(Guest)のフォルダを共有する

目的 VertualBoxでWindowsとUbuntuのファイルを共有する 前提 VerturlBox 3.16 ホストOSはWindows7 64bit VerturlBoxで動くゲストOSはUbuntu10.04 Ubuntu側にゲストアディッションがインストールされている 作業 Windows側 共有するフォルダを作成する。 例…

半角スペースを含むアルファベットで構成された複合名詞を抽出する

形態素解析した結果から、複合名詞を抽出するときに出現した問題 複合名詞(格フレームではない)を抽出するときは、基本的に名詞の連続を抽出する。 しかし、形態素解析の結果から、名詞の連続を単に追記して抽出した場合 以下のようなスペース区切りの文節…

Ubuntu10.04にCabochaをインストールする

参考にしたページ いつもお世話になっているSyo-Takasakiさんのエントリ [NLP][Ubuntu]UbuntuにUTF-8版のcabochaを簡単にインストールする方法 http://d.hatena.ne.jp/Syo-Takasaki/20090528/1243484754 基本手順 基本手順ははSyo-Takasakiさんのエントリ通…

exec()を使わずに、Javaからmecabを呼べるのか

※前提 mecabを呼ぶ専用のライブラリは使わない。 JavaではなくGroovyを使う!! 環境はVirtualBoxで仮想化したUbuntu10.04、IDEはNetbeans6.8を使った。 (Netbeansだと、数クリックでGroovyを有効にできるのでw) Groovyのコード import java.util.ArrayLis…

while((line = br.readLine) != null){}でwhileが終了しない

おまじないを信じたとき public static String getString(){ String result_string = new String(); try{ BufferedReader br = new BufferedReader(new InputStreamReader(System.in, "UTF-8")); String line = new String(); while((line = br.readLine()) …

オリジナルのオブジェクト(AllayList)の大小を比較するJavaプログラム

AllayListの中身を別クラスで定義 例) public class exampleClass { public String text; public int figure; } 上記の例の型をAllayListの型に指定し、int型のfigureを比較してStringのtextをソートしたい。 public static ArrayList getSort(ArrayList<exapmleClass> ex</exapmleclass>…

日本語WordnetのJavaフロントエンドを利用して,類義語の検索を行った.

参考にしたページはこちら. >>http://w-it.jp/shima/2009/03/wordnet_java_api.html このJAWJAWというJavaAPIを利用する. 準備 JAWJAWを利用するにあたって,必要なライブラリが3つある. sqlite-jdbc-3.6.11.jar nestedvm-1.0.jar Makefileからjarを生成…

MeCabの形態素解析速度を出力する

MeCabの形態素解析する速度を計測して,研究に耐えうるものか計ることになった. 以下に計測方法とその結果を示す. [user name]@ubuntu-vm:~$ time mecab mecab-test/100k-ntt.txt > /dev/null real 0m1.135s user 0m0.016s sys 0m0.020s time mecabという…

WindowsXPとVMwareで動くUbuntuで(Sambaを使った)共有フォルダを作る

Windowsでやること 共有フォルダを適当な場所に作る. 1.新規フォルダの作成 2.右クリックから「共有とセキュリティ」を選択 3.ネットワーク上でこのフォルダを共有にチェックをつけ,共有名を入力 4.ネットワークユーザーによるファイルの変更を許可する に…

連続XMLHttpRequest

javascriptをつかって,数回連続でAPI(ニコニコ動画API)にアクセスしようとしたところ上手くいかなかった. while(i<3){ var XMLobj = new XMLHttpTequest(); url = "http://hogehoge" + i; XMLobj.open("GET",url); XMLobj.setRequestHeader("Content-typ…

Rapidsvnの導入とリポジトリの追加

RapidsvnをUbuntu上に導入する方法とTracのリポジトリを追加する方法の備忘録 Rapidsvn導入 インストールコマンド:sudo apt-get install rapidsvn 日本語化 Zefar's Labo RapidSVN 0.9.4 日本語化 http://zefard.cocolog-nifty.com/labo/2007/05/rapidsvn_0…

GUID

Firefoxのアドオン作成などでよく利用しているGUIDのジェネレータ. GUIDgen.com http://www.guidgen.com/ いちいちGUID.exeみたいなの入れなくてもいいから楽ちんね.

TracのWiki作成方法

TracのWiki作成方法は ttp://...tracaddress.../new_page (一応h抜き) とすることでnew_pageの新しいページが表示される.開いたページには「Describe new_page here.」と表示されており,その下に 「Create this page」というボタンがある.このボタンか…

ソースコードを載せるときの注意・・・的なモノ.

div style="font-size:x-small;"でくくるとソースコード全体のサイズを小さくできる.普通にspanで小さくしようとすると一行しか小さくならなかったりする.