10万行くらいのテキストデータ(しかも個々のテキストが結構長い)の重複をカウントしたくて、DBでGROUP BYとか組み合わせたやけに長いSQLを組んでもみてもよかったけど、表計算アプリ上でさくっとできないかな、と思って、OOoとLibreOfficeとExcelでCOUNTIF関数を使ってみた。結果的にどれもうまくいかず、かえって時間がかかるはめに。
結果が返ってくるまで2, 30分とか待たされたり、うまく重複がカウントできていない行があったり。(OOoとLibreOfficeが似たような挙動になるのはわかるけど、何故かExcelまで似たような挙動)
んで、しゃーないから、目的の列でソートしたあと、一個上と比較してカウントしたりする数式を作ってしのいだ。統計的なデータだけならLibreOfficeのピボットテーブルが使いやすいんだけど(しかも10万行とかあってもサクッと処理できてちょっとうれしい)、素の表に重複数のカラムを追加するのが目的だったので。メモ。
旧日記 http://blog.good-day.net/~tani/diary/ から、こっちへ本格的に移転中。
本ページは谷 列樹(たに つらき)の備忘録です。
実在の団体・人物とは関係ないと思います。
2011年9月26日月曜日
つぃったー ウィジェット
右側が寂しいので、つぃったーでも表示させてみようかと、調べてみると、
ようはつぃったーさんが提供してくれてるJavaScriptのコード(ウィジェット)を
貼りつけるだけでいけるみたいなので、やってみた。
結構アレなことも書いてるので、あまりにも恥ずかしかったら外そう。
ようはつぃったーさんが提供してくれてるJavaScriptのコード(ウィジェット)を
貼りつけるだけでいけるみたいなので、やってみた。
結構アレなことも書いてるので、あまりにも恥ずかしかったら外そう。
2011年9月20日火曜日
2011年9月14日水曜日
OOo(Windows版)のアンインストール時に開くサイト
OOo(Windows版)のアンインストール時に開くサイトに関してちょっと調べたのでメモ。
URLは、設定ファイル類はなくて、ソースのsetup_native/source/win32/customactions/relnotes/relnotes.cxxに
"http://surveys.services.openoffice.org/deinstall"
って直書きされてるのを発見。
ここを書き換えて、独自ビルドしたら、飛ばす先は変えられそう。
で、このサイトを開く動作の呼び出しは、ソースのscp2/source/ooo/windowscustomaction_ooo.scpに書いてあって、
WindowsCustomAction gid_Customaction_ShowSurvey
Name = "ShowSurveyAfterUninstall";
Typ = "65";
Source = "relnotes.dll";
Target = "ShowSurveyAfter";
Inbinarytable = 1;
Assignment1 = ("InstallExecuteSequence", "REMOVE=\"ALL\" and Not UPGRADINGPRODUCTCODE", "end");
End
となってる。これ、どうもmsiファイルのテーブル定義らしく、msiの中身をみれるツールで見てみると、確かにそのものズバリの項目があったので、それを削除したmsiでOOoのインスコしてみると、アンインストール時にブラウザが開かれなくなった。
追記:LibreOfficeのWindows版ではこの機能なさそう。(http://cgit.freedesktop.org/libreoffice/bootstrap/tree/scp2/source/ooo/windowscustomaction_ooo.scp)
URLは、設定ファイル類はなくて、ソースのsetup_native/source/win32/customactions/relnotes/relnotes.cxxに
"http://surveys.services.openoffice.org/deinstall"
って直書きされてるのを発見。
ここを書き換えて、独自ビルドしたら、飛ばす先は変えられそう。
で、このサイトを開く動作の呼び出しは、ソースのscp2/source/ooo/windowscustomaction_ooo.scpに書いてあって、
WindowsCustomAction gid_Customaction_ShowSurvey
Name = "ShowSurveyAfterUninstall";
Typ = "65";
Source = "relnotes.dll";
Target = "ShowSurveyAfter";
Inbinarytable = 1;
Assignment1 = ("InstallExecuteSequence", "REMOVE=\"ALL\" and Not UPGRADINGPRODUCTCODE", "end");
End
となってる。これ、どうもmsiファイルのテーブル定義らしく、msiの中身をみれるツールで見てみると、確かにそのものズバリの項目があったので、それを削除したmsiでOOoのインスコしてみると、アンインストール時にブラウザが開かれなくなった。
追記:LibreOfficeのWindows版ではこの機能なさそう。(http://cgit.freedesktop.org/libreoffice/bootstrap/tree/scp2/source/ooo/windowscustomaction_ooo.scp)
2011年9月8日木曜日
VBAからパスワードつきPPTファイルを開く (Office 2003)
VBAからパスワード付きPowerPointファイルを開く、ってのはどうも普通にやっても無理くさい。(ファイルを開くOpenメソッドがパスワードのパラメータを持っていない)
SendKeysで、無理やりパスワードのキーコードをPowerPointさんに送りつけるってやり方もあるらしいけど、謎のタイミング勝負になってしまうので、このやり方は、やめといたほうが無難。
で、何回もぐぐった結果、パッチがあたったOffice 2003なら、Application.Presentations.Open("ファイルパス", オプション...)のファイルパス部分にくっつけて、"C\TEMP\hogehoge.ppt::fugafuga"みたいな感じで、指定できるとのこと。(fugafugaが開くパスワード)
http://support.microsoft.com/kb/916154/en
SendKeysで、無理やりパスワードのキーコードをPowerPointさんに送りつけるってやり方もあるらしいけど、謎のタイミング勝負になってしまうので、このやり方は、やめといたほうが無難。
で、何回もぐぐった結果、パッチがあたったOffice 2003なら、Application.Presentations.Open("ファイルパス", オプション...)のファイルパス部分にくっつけて、"C\TEMP\hogehoge.ppt::fugafuga"みたいな感じで、指定できるとのこと。(fugafugaが開くパスワード)
http://support.microsoft.com/kb/916154/en
LibreOfficeのAPIリファレンス
ができたらしいので。
http://api.libreoffice.org/
http://api.libreoffice.org/docs/common/ref/com/sun/star/module-ix.html
まだググれないみたいだけど。メモ。
http://api.libreoffice.org/
http://api.libreoffice.org/docs/common/ref/com/sun/star/module-ix.html
まだググれないみたいだけど。メモ。
2011年9月5日月曜日
VBAのApplication.FileSearch
VBAのApplication.FileSearchはOffice2007以降からは廃止されてるので、使わない方が良いとされてるけど、ディレクトリを再帰的に検索したいときとかは楽ちんなのでつい使ってしまいます。(てか楽にプログラムできることがウリのVBAなのに、再帰関数とか実装すんの、めんどくさすぎ)
んで、そのApplication.FileSearchで、ファイルがあるはずなのに、検索できないというトラブルがあったのでメモ。
原因は、Windows XPの検索機能のインデックスが更新されていなかったことで、Excelのファイル→ファイル検索で出てくる左側ペインの検索オプションというリンクで「いいえ、インデックスサービスを開始しません」を選ぶと解決。
んで、そのApplication.FileSearchで、ファイルがあるはずなのに、検索できないというトラブルがあったのでメモ。
原因は、Windows XPの検索機能のインデックスが更新されていなかったことで、Excelのファイル→ファイル検索で出てくる左側ペインの検索オプションというリンクで「いいえ、インデックスサービスを開始しません」を選ぶと解決。
2011年9月4日日曜日
前のデータの救出
とりあえず前の/home/tani/からTdiaryのデータをtar.gzに固めてSCPでもってきた。
さて、どうすっかなー。
http://geodenx.blogspot.com/2010/01/migration-from-tdiary-to-blogger.html
このへんみながらボチボチやろうかと思っているところ。
さて、どうすっかなー。
http://geodenx.blogspot.com/2010/01/migration-from-tdiary-to-blogger.html
このへんみながらボチボチやろうかと思っているところ。
登録:
投稿 (Atom)