Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

[動詞] + こと+ [助詞] + {(不)可能, できる} も検出する #18

Open
shirayu opened this issue Jan 5, 2019 · 1 comment
Open

Comments

@shirayu
Copy link
Contributor

shirayu commented Jan 5, 2019

[動詞] + こと+ [助詞] + {(不)可能, できる} も,dict1, dict2同様に冗長です.

  • 「読むことができる」→「読める」
  • 「寝ることができない」→「寝られない」
  • 「愛することができる」→「愛せる」 (注: 「愛する」はkuromojiでは1語扱い)
  • 「来ることは可能」→「来られる」

Related to #7

@shirayu
Copy link
Contributor Author

shirayu commented Jan 6, 2019

以下のような変更を加えると,

         id: "dict2",
         disabled: false,
         allows: [],
-        message: `"する$4$3$5$1$2"は冗長な表現です。"する$4$3$5"を省き簡潔な表現にすると文章が明瞭になります。`,                                            
+        message: `"$6$4$3$5$1$2"は冗長な表現です。"$6$4$3$5"を省き簡潔な表現にすると文章が明瞭になります。`,                                                
         url: "http://qiita.com/takahi-i/items/a93dc2ff42af6b93f6e0",
         expected: "$3$1$2",
         tokens: [
             {
-                surface_form: "する",
                 pos: "動詞",
-                pos_detail_1: "自立",
-                pos_detail_2: "*",
-                pos_detail_3: "*",
-                conjugated_type: "サ変・スル",
-                conjugated_form: "基本形",
-                basic_form: "する",
-                reading: "スル",
-                pronunciation: "スル"
+                _capture: "$6",
+                _readme: "[動詞]",
+                _capture_to_message: (actualToken) => {
+                    if (actualToken.basic_form === "する") {
+                        return "する";
+                    }
+                    return "";
+                },
             },

意志性の低い動詞や,受身文で既に受身の接辞が付加されている場合などは,「ことができる」の形しか使えない,との記述が有ります.

  • 人は1人では{育つことができない/ *育てない}。
  • あいつにだけは絶対{抜かれることはできない/* 抜かれられない}。

https://qiita.com/takahi-i/items/a93dc2ff42af6b93f6e0#comment-850ec4d194748453a39a

に当てはまるケースを誤検知してしまいますね.

とはいえ,Recall重視だと検知したいところです.

「する」のみを対象とするか「動詞」を対象とするかを,#8 同様に設定で切り替えられると良いかもしれません.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

1 participant