勉強用に作った検索エンジン。やったことは以下のとおり。
- Webクローラの構築
- Mecabで日本語の形態素解析
- 検索エンジンの構築
- データをMongoDBに格納
- FlaskでWebアプリ作成
詳しくはブログのほうに書きます(Programming Log)。
- Python 2.7
- pip
- MeCab
-
Clone repository
$ git clone [email protected]:mejiro/SearchEngine.git
-
Install Mecab
$ # MeCab $ brew install mecab mecab-ipadic $ # Python binding $ wget https://mecab.googlecode.com/files/mecab-python-0.996.tar.gz $ workon search_engine $ pip install mecab-python-0.996.tar.gz # これでいれれる! $ rm mecab-python-0.996.tar.gz
-
Install python packages
$ cd SearchEngine $ pip install -r requirements.txt
-
MongoDB settings
Please rewrite MONGO_URL in settings.py
-
Run
$ python run-crawler.py # build a index $ python run-webapp.py # access to http://127.0.0.1:5000
$ tree .
.
├── README.md
├── config.py
├── requirements.txt
├── run-crawler.py
├── run-webapp.py
├── search_engine
│ ├── __init__.py
│ ├── static
│ ├── templates
│ │ └── index.html
│ └── views.py
└── web_crawler
├── __init__.py
├── crawler.py
└── drop_collection.py