-
Notifications
You must be signed in to change notification settings - Fork 0
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
RedDataTools の red-datasets にデータセットを追加する #23
Comments
issue から何やるか探す。 https://github.com/red-data-tools/red-datasets/issues
あたりが良さそうかなと思った。 |
青空文庫にしよう。 とりあえずRepository をclone して動かし方見てみる。 |
とりあえずFork |
clone
|
ruby は最新の
|
結構時間かかるぜやばい。さきにやっておけばよかった。 |
yeah |
らしいぞ。 |
test 実行する
とりあえず動いたからこれでいいのかしら。 |
|
やるべきこと。
余力があったら(相談して)
かなぁ。 |
おっけー、これで準備は整った。 やっていくぞ。 |
How to contribute 的なドキュメントもあったほうがよいだろうなぁ。 |
ってあたりは基本的な要素として実装すればいいっぽい。 |
https://www.aozora.gr.jp/guide/kijyunn.html
どこだ? ライセンスは |
拡充版とは? |
CIFARみたいにどちらも選べるように実装するのが良さそう。 |
Metadataのdescription の実装は lambda わたせるようにってことかぁ。なるほど。 |
データのダウンロードには data_path = cache_dir_path + 'normal.zip'
unless data_path.exist?
data_url = 'https://www.aozora.gr.jp/index_pages/list_person_all_extended_utf8.zip'
data_url = 'https://www.aozora.gr.jp/index_pages/list_person_all_utf8.zip'
download(data_path, data_url)
end つぎはこいつを解凍してCSVにして読み込めばいい。 |
https://docs.ruby-lang.org/ja/latest/class/Zlib=3a=3aGzipReader.html 標準ライブラリでGzipReaderはあるんだけどなー。 |
postal-code-japan でも zip を扱っておる。 |
これこのまま同じコードでいいか、という感じ。 |
"\xEF" from ASCII-8BIT to UTF-8 (Encoding::UndefinedConversionError) エラー出た。 |
BOM付きUTF8である。 |
csv_file_stream.read.force_encoding(Encoding::UTF_8) bom付きUTF8の指定ほうほうがわからんので、force_encoding にした。
|
|
test 単体で動かしたいけど。。。 |
これでいける。 |
https://spdx.org/licenses/ |
プロジェクトにさんかする。
https://red-data-tools.github.io/ja/
https://gitter.im/red-data-tools/ja
The text was updated successfully, but these errors were encountered: