Hangul.js는 한글로 이루어진 문장의 자음과 모음을 분리하는 자바스크립트 라이브러리입니다. 이 라이브러리를 이용하여 한글검색, 초성검색 등을 할 수 있습니다.
bower install hangul-js
npm install hangul-js
var Hangul = require('hangul-js');
웹 페이지에서 사용하려면 hangul.js 파일을 <script>
태그를 이용하여 삽입합니다.
<script src="hangul.js" type="text/javascript"></script>
자바스크립트 코드에서 전역에 노출된 Hangul이라는 객체를 통해 접근할 수 있습니다.
Hangul // window.Hangul
Hangul.disassemble(str:string, grouped:boolean = false)
은 문자열 str
에 있는 한글을 자음/모음으로 분리하여 문자들의 배열로 돌려줍니다. 이 때 한글이 아닌 문자는 그대로 반환됩니다. Hangul.d
처럼 짧은 이름으로 사용할 수도 있습니다.
Hangul.disassemble('가나다'); // ['ㄱ','ㅏ','ㄴ','ㅏ','ㄷ','ㅏ']
Hangul.disassemble('ab가c'); // ['a','b','ㄱ','ㅏ','c']
Hangul.disassemble('ab@!23X.'); // ['a','b','@','!','2','3','X','.']
같은 홑낱자로 이루어진 겹낱자는 분리되지 않습니다.
Hangul.disassemble('ㄲ'); // ['ㄲ']
다른 홑낱자로 이루어진 겹낱자는 분리됩니다.
Hangul.disassemble('ㄳ'); // ['ㄱ','ㅅ']
Hangul.disassemble('ㅚ'); // ['ㅗ','ㅣ']
추가적으로 grouped
옵션을 true
로 설정하여 문자열의 각 글자별로 따로 분리할 수 있습니다.
Hangul.d('매드캣MK2', true);
// [['ㅁ', 'ㅐ'], ['ㄷ', 'ㅡ'], ['ㅋ', 'ㅐ', 'ㅅ'], ['M'], ['K'], ['2']]
두벌식 키보드로 주어진 문자열을 입력할 때 누르는 키들의 배열이라고 생각하면 쉽습니다.
Hangul.assemble(arr:string[])
는 한글 자음/모음들의 배열 arr
을 인자로 받아 이를 조합한 문자열을 돌려줍니다. 이 때 한글이 아닌 문자는 그대로 반환됩니다. Hangul.a
처럼 짧은 이름으로 사용할 수도 있습니다.
Hangul.assemble(['ㄱ','ㅏ','ㄴ','ㅏ','ㄷ','ㅏ']); // '가나다'
Hangul.assemble(['a','b','ㄱ','ㅏ','c']); // 'ab가c'
Hangul.assemble(['a','b','@','!','2','3','X','.']); // 'ab@123X.'
이 경우에도 두벌식 키보드에서 주어진 키들을 누를 때 만들어지는 문자열을 돌려준다고 생각하면 쉽습니다.
Hangul.assemble(['ㅗ','ㅐ']); // 'ㅙ'
Hangul.assemble(['ㄹ','ㅂ','ㅅ']); // 'ㄼㅅ'
Hangul.disassemble
함수와 역함수 관계가 아닙니다.
Hangul.a(Hangul.d('옽ㅏ')); // '오타' ('옽ㅏ' 가 아님)
Hangul.search(a:string, b:string)
는 문자열 a
가 문자열 b
를 포함하는지 검사합니다. 이때 포함관계는 '두벌식 키보드 기준으로 a문자열을 입력할 때 누르는 키들의 배열이 b문자열을 입력할 때 누르는 키들의 배열을 포함한다'로 정의합니다. 반환값이 0보다 크거나 같다면 포함합니다.
Hangul.search('달걀','닭'); // 0
Hangul.search('달걀','알'); // -1
indexOf
함수와 다릅니다.
var a = '도우미'
, b = '도움';
a.indexOf(b); // -1
Hangul.search(a, b); // 0
실제 사용할 때에는 하나의 단어를 여러개의 문자열과 비교하므로 Hangul.Searcher
를 사용하는게 편합니다.
var searcher = new Hangul.Searcher('닭');
searcher.search('달걀'); // 0
searcher.search('달구지'); // 0
searcher.search('달무리'); // -1
Hangul.rangeSearch(a:string, b:string)
는 a
문자열에서 b
문자열을 모두 찾고 일치하는 범위를 a
문자열 상의 인덱스로 돌려줍니다. 만약 b
문자열을 찾지 못했다면 빈 배열을 돌려줍니다. 검색 시스템에서 일치하는 부분을 강조하려고 할 때 유용합니다.
var a = '간장공장공장장',
b = '공장';
Hangul.rangeSearch(a, b); // [[2, 3], [4, 5]]
이하 함수들은 인자로 문자를 받습니다. 자바스크립트에서는 문자 타입이 없으므로 문자열로 대체합니다. 길이가 2 이상인 문자열의 경우 첫 한글자에 대해 판단합니다.
주어진 문자가 완성된 한글인지 아닌지 판단합니다. 완성된 한글이란 유니코드로 '가'(0xAC00) ~ '힣'(0xD7A3) 사이에 있는 문자를 말합니다. 'ㄱ', 'ㅙ' 등은 완성된 한글이 아닙니다.
주어진 문자가 자음인지 판단합니다.
주어진 문자가 모음인지 판단합니다.
주어진 문자가 초성으로 쓰일 수 있는지 판단합니다. 'ㄲ'은 초성으로 쓰일 수 있지만 'ㄳ'는 초성으로 쓰일 수 없습니다.
주어진 문자가 종성으로 쓰일 수 있는지 판단합니다. 'ㄲ'은 종성으로 쓰일 수 있지만 'ㄸ'는 종성으로 쓰일 수 없습니다.
주어진 문자가 자음으로 끝나는지 판단합니다. 받침이 있거나 자음 하나가 인자로 주어지면 true
를 아닌 경우 false
를 반환합니다. 한글이 아닌 경우는 false
를 반환합니다.
여기에 주어진 문장에서 예사소리(ㄱ, ㄷ, ㅂ, ㅅ, ㅈ)와 거센소리(ㅋ, ㅌ, ㅍ, ㅊ)를 된소리(ㄲ, ㄸ, ㅃ, ㅆ, ㅉ)로 바꾸는 예제가 준비되어 있습니다.
핵심 코드는 다음과 같습니다.
var input = '아버지가 방에 들어가신다'
function stronger(x){
if(x == 'ㄱ' || x == 'ㅋ') return 'ㄲ';
if(x == 'ㄷ' || x == 'ㅌ') return 'ㄸ';
if(x == 'ㅂ' || x == 'ㅍ') return 'ㅃ';
if(x == 'ㅅ') return 'ㅆ';
if(x == 'ㅈ' || x == 'ㅊ') return 'ㅉ';
return x;
}
console.log(Hangul.a(Hangul.d(input).map(stronger)));
// 아뻐찌까 빵에 뜰어까씬따
코드를 수정하셨다면 꼭 grunt
명령어를 통해 테스트를 수행해 주세요. 현재 마스터 브랜치에 있는 코드의 테스트 결과는 여기서 보실 수 있습니다.