-
Notifications
You must be signed in to change notification settings - Fork 0
/
chasen.spec.in
144 lines (118 loc) · 4.66 KB
/
chasen.spec.in
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
%define prefix /usr
%define PACKAGE @PACKAGE@
%define VERSION @VERSION@
%define RELEASE 1
Summary: Japanese Morphological Analysis System, ChaSen
Name: %{PACKAGE}
Version: %{VERSION}
Release: %{RELEASE}
Source: %{name}-%{version}.tar.gz
Copyright: 2003 Nara Institute of Science and Technology, Japan.
URL: http://chasen.aist-nara.ac.jp/
BuildRoot: /var/tmp/%{name}-%{version}-root
Group: Extensions/Japanese
Provides: chasen
Vendor: 茶筌管理開発担当者集団
Distribution: 茶筌管理開発担当者集団
Packager: Taku Kudoh <[email protected]>
%description
計算機による日本語の解析において,欧米の言語の解析と比べてまず問題になるの
に次の2点があります.一つは形態素解析の問題です.ワードプロセッサの普及など
によって日本語の入力には大きな問題がなくなりましたが,計算機による日本語解
析では,まず入力文内の個々の形態素を認識する必要があります.これには実用に
耐えられるだけの大きな辞書も必要であり,これを如何に整備するかという問題も
同時に存在します.もう一つの問題として,日本語には広く認められ同意を得られ
た文法,ないし,文法用語がないという現実です.学校文法の単語分類および文法
用語は一般には広く知られていますが,研究者の間ではあまり評判がよくありませ
んし,計算機向きではありません.
日本語の解析に真っ先に必要な形態素解析システムは,多くの研究グループによっ
て既に開発され技術的な問題が洗い出されているにも係わらず,共通のツールとし
て世の中に流布しているものはありません.計算機可読な日本語辞書についても同
様です.
本システムは,計算機による日本語の解析の研究を目指す多くの研究者に共通に使
える形態素解析ツールを提供するために開発されました.その際,上の二つ目の問
使用者によって文法の定義,単語間の接続関係の定義などを容易に変更
できるように配慮しました.
大学で小人数で開発したシステムであり,色々な点で不完全な部分があると思いま
す.可能な限り順次改良を重ねる予定です.皆様の寛容な利用をお願いいたします.
本茶筌システムの原形は,京都大学長尾研究室および奈良先端科学技術大学院大学
松本研究室において開発された日本語形態素解析システムJUMAN(version2.0)です.
JUMANは,京都大学および奈良先端科学技術大学院大学のスタッフおよび多くの学生
の協力を得て作成したものです.また,辞書に関しては,Wnnかな漢字変換システム
の辞書,および,ICOTから公開された日本語辞書を利用し,独自に修正を加えまし
た.JUMAN 2.0をともに開発した京都大学の黒橋禎夫さん,現在キャノン勤務の妙木
裕さんには特に感謝いたします.
JUMAN開発のきっかけを作って下さった京都大学長尾真先生に感謝します.JUMAN開
発に関して様々な形で協力していただいた奈良先端大宇津呂武仁氏に感謝します.
奈良先端大の知念賢一氏には,茶筌システムの開発に関して多くの助言をいただき
ました.
奈良先端大在学時の今一修氏,今村友明氏には茶筌1.0の開発の際に種々の助
力をいただきました.両氏および茶筌の開発に協力いただいた松本研究室のメ
ンバーに深く感謝します.
奈良先端大の鹿野清宏教授を代表とする「日本語ディクテーショ
ン基本ソフトウェアの開発」グループの方々には,IPA品詞体系辞書の大幅な
整備を行っていただきました.特に,御尽力いただいた電子技術総合研究所の
伊藤氏,ASTEMの山田篤氏に感謝いたします.
また,一人一人の名を挙げることはできませんが,JUMANシステムおよび
茶筌システムに対して多くのコメントと質問をいただいた利用者の方々に感謝します.
本システムに関するお問い合わせは以下にお願いします.
〒630-0192
奈良県生駒市高山町8916-5
奈良先端科学技術大学院大学
情報科学研究科 松本研究室
茶筌管理開発担当者集団
Tel: (0743)72-5240, Fax: (0743)72-5249
E-mail: [email protected]
%package devel
Summary: Libraries and header files for ChaSen developers
Group: Development/Libraries
Requires: %name = %{VERSION}
%package perl
Summary: ChaSen Perl Module
Group: Extensions/Japanese
Requires: perl >= 5.6
Requires: %name = %{VERSION}
%description devel
Libraries and header files for ChaSen developers.
茶筌のライブラリとヘッダファイルです.
%description perl
ChaSen Perl Module.
このモジュールは、奈良先端科学技術大学が作成した形態素解析ソフトウェア
「茶筌」をperlから扱うためのものです.
%prep
%setup
%build
./configure --prefix=%{prefix}
make CFLAGS="$RPM_OPT_FLAGS"
cd perl; perl Makefile.PL
make INC="-I../src -I%{prefix}/include -I/usr/include" \
LDDLFLAGS="-shared -Wl,-rpath -Wl,%{prefix}/lib -L../lib/.libs -lchasen"
CCFLAGS="$CCFLAGS -Dna=PL_na -Dsv_undef=PL_sv_undef"
cd ..
%install
make prefix=$RPM_BUILD_ROOT%{prefix} install
cd perl
make PREFIX=$RPM_BUILD_ROOT%{prefix} INSTALLMAN3DIR=$RPM_BUILD_ROOT%{prefix}/man/man3 install
cd ..
%clean
rm -rf $RPM_BUILD_ROOT
%post -p /sbin/ldconfig
%postun -p /sbin/ldconfig
%files
%defattr(-,root,root,-)
%doc doc/*.tex doc/*.pdf
%{prefix}/bin/*
%{prefix}/lib/*.so.*
%{prefix}/share/chasen/prolog/*
%{prefix}/libexec/chasen/*
%files devel
%defattr(-,root,root,-)
%{prefix}/include/*
%{prefix}/lib/*.so
%{prefix}/lib/*.a
%{prefix}/lib/*.la
%files perl
%defattr(-,root,root,-)
%doc perl/README
%{prefix}/lib/perl5/site_perl/*
%{prefix}/man/*