Neueste Datei-Release

handic-mecab (20230109)2023-01-09 22:24
mkhandic-mecab (0.2)2022-03-14 22:33
tools (mecab-k2alpha)2019-10-03 21:38

初めての方へ

関連情報

한국어 문서

最近の更新 (Recent Changes)

2023-01-09
2022-01-31
2020-02-08
2019-10-03
2018-05-13
2018-05-01
2018-04-30

HanDicの変更履歴

20230109

handic-mecab-20230109_bin.zip / handic-mecab-20230109_src.tar.gz

* 現況:項目数 117,499,学習用データ 6,547文

20220130

handic-mecab-20220130_bin.zip / handic-mecab-20220130_src.tar.gz

  • 現況:項目数 116,274,学習用データ 5,025文
  • 学習用データ追加
  • 項目を追加
    • Noun.supplement.csv: 경제고(經濟苦), 긴꼬리딱새, 고라니, 눈꼬리, 달맞이꽃, 과민증(過敏症), 동물학자(動物學者), 배선망(配線網), 지향점(指向點), 무위도식(無爲徒食), 발효조(醱酵槽), 온정주의(溫情主義), 정치권01(政治圈), 절치부심(切齒腐心), 유튜버(YouTuber), 무속인(巫俗人), 방임03(放任), 양모03(養母), 양부06(養父), 양부모(養父母), 누리꾼, 댓글(對글), 댓글창(對글窓), 빙의(憑依), 국가02(國歌), 금붕어(金붕어), 구름다리, 그끄저께, 그끄제, 그그제('그끄제'의 방언), 괴롬('괴로움'의 준말), 급행(急行), 근심거리, 근심사(근심事), 밥공기(밥空器), 생선구이(生鮮구이), 고등어구이, 손금01, 인후염(咽喉炎), 당기03(黨紀), 층수(層數), 도어80(door), 동절(冬節), 하절(夏節), 보이스피싱, 비트코인(通貨名として), 증빙(證憑), 환급(還給), 모니터링(monitoring), 수사처(搜査處), 공포01(公布), 전80(前, **전**·현직), 경무관(警務官), 장성06(將星,"준장/소장/중장/대장"), 재택80(在宅), 등80(登,**등**·하교), 가제08(Gaze), 간담01(肝膽), 개미허리, 건04(件), 관형사(冠形詞), 광어(廣魚), 그글피, 그레이프프루트(grapefruit), 근시03(近視), 글꼴, 금상04(金賞), 까불이, 까짓것, 깔개, 깝질, 남극01(南極), 넓적다리, 넙치, 노대04(露臺), 느낌표(느낌標), 다운로드(download), 담뱃재, 대07(代), 대11(隊), 대장10(隊長), 덧창(덧窓), 도랒, 동급(同級), 동해01(東海), 따개, 따옴표(따옴標), 라이트01(light), 레인지(range), 렌터카(rent-a-car), 마가린(margarine), 마른안주(마른按酒), 말줄임표(말줄임標), 맛버섯, 망치질, 문어02(文語), 물만두(물饅頭), 별걱정(別걱정), 별꼴(別꼴), 별놈(別놈), 별사람(別사람), 보어01(補語), 복자음(複子音), 붕어빵, 비번00(非番), 사잇길, 세이프(safe), 소수04(小數), 송료(送料), 송이03(松耳/松栮), 송이버섯(松耳버섯), 순사질(巡査질), 술기(술氣), 술내, 스탬프(stamp), 실톱, 엊그저께, 엠피스리(MP three), 연12(緣), 오프라인(off-line), 요전번(요前番), 웃사람, 원그래프(圓graph), 원시07(遠視), 웨이트리스(waitress), 육회(肉膾), 일보04(日報), 젖니, 제비01, 제수01(弟嫂), 제수씨(弟嫂氏), 조모01(祖母), 존함02(尊銜), 짜장면, 체적02(體積), 축전02(祝電), 카스텔라(castela), 콘센트(concentric plug), 특급01(特急), 페리01(ferry), 페리보트(ferryboat), 펜션(pension), 평복02(平服), 푸딩(pudding), 풀질, 하이픈(hyphen), 허브티(herb tea), 헌데, 홍삼02(紅蔘), 후면02(後面), 쾌속(快速), 가위질, 관용02(慣用), 금주06(禁酒), 당일치기(當日치기), 디스카운트(discount), 띄어쓰기, 반품02(返品), 수군덕질, 수상13(授賞), 왕진(往診), 일람(一覽), 존대02(尊待), 좌회전(左回轉), 주유05(注油), 착신(着信), 청강02(聽講), 체크아웃(check-out), 품절(品切), 하이킹(hiking), 해열(解熱), 회답(回答), 흙질, 남자아이(男子아이), 눈사람, 여자아이(女子아이), 매해(每해), 매달(每달), 매번(每番), 케익(cake), 맥주잔(麥酒盞), 생사고락(生死苦樂), 선견지명(先見之明), 작심삼일(作心三日), 가격표(價格表), 가루약(가루藥), 각방03(各房), 각인01(各人), 거센소리, 거스름, 격음(激音), 곰국, 과보호(過保護), 금화02(金貨), 까망, 낭하(廊下), 놀이동산, 농음02(濃音), 답서(答書), 더럼, 독학03(獨學), 딴말01, 막냇동생, 맏나물, 맑은국, 무의식(無意識), 미남자(美男子), 미용사(美容師), 발명왕(發明王), 벌꿀, 부침개, 불가능(不可能), 비빔냉면(비빔冷麵), 삼면기사(三面記事), 수사25(數詞), 스케이트장(스케이트場), 실험장(實驗場), 양복지(洋服地), 캠핑, 털가죽, 통역사(通譯士), 파자마, 평음(平音), 폐관02(閉館), 폐회(閉會), 피시방(피시房), 빨랫감, 가다랑어, 가르마, 가마03, 가맹(加盟), 가자미눈, 간고03(艱苦), 간담02(懇談), 간병01(看病), 감수11(感受), 개똥벌레, 갯가재, 거름종이, 건달패(乾達牌), 검열관(檢閱官), 검찰관01(檢察官), 게걸01, 격일(隔日), 격주(隔週), 결번(缺番), 경도07(經度), 경륜03(競輪), 경정09(競艇), 경조13(慶弔), 계부02(繼父), 고국산천(故國山川), 고심분투(苦心奮鬪), 고자질(告者질), 고조14(高潮), 곤약(菎蒻), 곰팡, 곱슬머리, 공작새(孔雀새), 과소02(過小), 과소03(過少), 과소05(過疏), 광견병(狂犬病), 광우병(狂牛病), 괴담(怪談), 구구02(九九), 구구법(九九法), 구김새, 구두창, 구명03(究明), 구역05(嘔逆), 국방색(國防色), 군입질, 굽이굽이, 귀뚜라미, 귀이게, 귀중01(貴中), 귀지01, 그믐께, 그믐밤, 극비리(極祕裡), 근린공원(近鄰公園), 금괴(金塊), 급정거(急停車), 기성복(旣成服), 기성세대(旣成世代), 기승전결(起承轉結), 기와지붕, 기장01, 뇌경색(腦梗塞), 눈가늠, 마른기침, 명일02(命日), 밑거름, 바닷가재, 반딧불이, 배트01, 비단구렁이(緋緞구렁이), 쌍가마01(雙가마), 우라늄광(우라늄鑛), 우량01(雨量), 입구린내, 집짐승, 힘겨룸, 청80(靑, 청와대=당**청** 협의), 전81(全, **전**·월세), 도미노(domino), 짝퉁, 한류80(韓流), 콘텐트(content), 스타트업(startup), 변리사(辨理士), 브로슈어(brochure), 탑승구(搭乘口), 선대위(選對委), 로스쿨(law school), 무착륙(無着陸), 출발지(出發地), 킥보드(kick board), 카트(cart), 항공료(航空料), 입소문(입所聞), 세리머니(ceremony), 해양법(海洋法), 유불리(有不利), 골든크로스(golden cross), 원팀(one team), 후폭풍(後暴風), 성매매(性賣買), 패싱(passing), 스텔스(stealth), 상임위(常任委), 환노위(環勞委), 문체위(文體委), 법사위(法司委), 보건위(保健委), 복지위(福祉委), 보건복지위(保健福祉委), 산업위(産業委), 산자위(産資委), 중기위(中企委), 산자중기위(産資中企委), 여가위(女家委), 여성위(女性委), 외통위(外統委), 외교위(外交委), 정무위(政務委), 행안위(行安委), 사개특위(司改特委), 예결위(豫決委), 예결특위(豫決特委), 윤리위(倫理委), 윤리특위(倫理特委), 정개특위(政改特委), 운영위(運營委), 과방위(科放委), 과기정위(科技情委), 과기정통위(科技情通委), 교육위(敎育委), 국토위(國土委), 농림위(農林委), 농수위(農水委), 농축위(農畜委), 농식품위(農食品委), 농해수위(農海水委), 탄도02(彈道), 해촉(解囑), 고검04(高檢), 대검02(大檢), 팬덤(fandom), 복당01(復黨), 지인03(知人), 알파02(alpha), 베타01(beta), 감마02(gamma), 델타01(delta), 엡실론(epsilon), 제타(theta), 에타(eta), 세타(theta), 요타(iota), 카파02(kappa), 람다(lambda), 뮤(mu), 크시(xi), 오미크론(omikron), 로04(rho), 시그마(sigma), 타우(tau), 입실론(upsilon), 피11(phi), 키06(khi), 프시01(psi), 제82(制, **제**·개정), 발안(發案), 청구권(請求權), 인수03(人數), 부령04(部令), 특례시(特例市), 일극(一極), 동남01(東南), 메가시티(megacity), 님비(NIMBY), 선관위(選管委), 시의원(市議員), 인허가(認許可), 교부세(交付稅), 녹취02(錄取), 구의회(區議會), 임시회(臨時會), 맵(map)
    • Noun.supplement.name.csv: 담(譚, 姓), 창흠(名), 윤모(名), 재갑(名), 은별(名), 순칠(名), 권욱(名), 태운(名), 성무(名)
    • Noun.supplement.org.csv: 문화관광부(文化觀光部), 사회과학원(社會科學院), 한국갤럽(韓國갤럽), 로이터통신(로이터通信), 국립감염병연구소(國立感染病硏究所), 대법원(大法院), 엘에이치(LH:한국토지주택공사), 블룸버그(Bloomberg), 롤스로이스(Rolls-Royce), 르노(Renault), 국제앰네스티(國際앰네스티), 파리바게뜨, 네파, 네이처리퍼블릭, 호식이두마리치킨, 풀무원, 한샘, 네네치킨, 탐앤탐스, 한국지식재산보호원(韓國知識財産保護院), 에어서울(Air Seoul), 관훈클럽(寬勳클럽), 록히드마틴(Lockheed Martin), 한국노동조합총연맹(韓國勞動組合總聯盟), 한국노총(韓國勞總), 안보리80(安保理), 국회입법조사처(國會立法調査處), 충북참여자치시민연대(忠北參與自治市民連帶)
    • Noun.supplement.proper.csv: 표준국어대사전(標準國語大辭典), 조선말대사전(朝鮮말大辭典), 여진족(女眞族), 월스트리트저널(Wall Street Journal), 백인종(白人種), 흑인종(黑人種), 뉴욕타임스(New York Times), 한국프레스센터(韓國프레스센터)
    • Noun.supplement.place.csv: 할리우드(Hollywood), 뉴욕시(뉴욕市), 브루클린(Brooklyn), 스태튼아일랜드(Staten Island), 태평양(太平洋), 대서양(大西洋), 지중해02(地中海), 제진(猪津), 전북도(全北道), 전남도(全南道), 경남도(慶南道), 경북도(慶北道), 충남도(忠南道), 충북도(忠北道)
    • Suffix.csv: 군11(群), 거리다/XSV
    • Ending.csv: -습디다, -려다(려고 하다가), -려다가(려고 하다가)
    • Verb.supplement_2.1syl.csv: 봉하다01(封하다), 뜻하다, 밥하다
    • Verb.supplement_3.std.csv: 굴다02('구르다'의 준말), 갖다주다('가져다주다'의 준말), 덧나다02, 굴러떨어지다, 끈적이다, 데려다주다, 되새기다02, 떨리다02, 모셔다드리다, 방글거리다, 배이다, 불리다05, 불쑥거리다, 비기다02, 비뚤거리다, 쐬다02, 치이다07, 타다06, 떨다02, 헐다01, 졸립다, 그리하다, 들리다05, 이리하다, 잘못되다, 저리하다, 채다07, 갈리다04, 글썽이다, 긁적이다, 긋다02, 까딱이다01, 다독이다, 불어닥치다
    • Adverb.csv: 그러루, 그끄저께, 그끄제, 그그제('그끄제'의 방언), 개골개골, 거듭거듭, 겸손히(謙遜히/謙巽히), 경쾌히(輕快히), 고불고불, 곤란히(困難▽히), 괴로이, 그러나저러나, 깔끔히, 꾸불꾸불, 끈적끈적, 나른히, 날카로이, 냉정히01(冷情히), 든든히, 따끔히, 매암매암, 멈칫멈칫, 메슥메슥, 방긋방긋, 방긋이01, 번거로이, 부디부디, 불쑥이, 불쾌히(不快히), 비참히(悲慘히), 살짝살짝, 서운히, 싱긋벙긋, 엊그저께, 예사로이(例事로이), 온종일(온終日), 우뚝이, 우울히(憂鬱히), 유창히(流暢히), 의아히(疑訝히), 익숙히, 점잖이, 종일토록(終日토록), 줄기줄기, 중대히(重大히), 지긋지긋이, 캄캄히, 평범히(平凡히), 하루건너, 하루걸러, 한가히(閑暇히), 호화로이(豪華로이), 매해(每해), 가만가만히, 고생고생(苦生苦生), 궁금히, 까옥까옥, 깜빡깜빡, 답답히, 똑03, 만약(萬若), 문뜩, 부끄러이, 불안히(不安히), 수많이(數많이), 심각히(深刻히), 안전히(安全히), 어떻든지, 여름내, 조심히(操心히), 가뜩02, 가뜩이02, 가소로이(可笑로이), 간간05(間間), 갸름갸름, 건들건들, 겸사겸사(兼事兼事), 고이고이, 고작해야, 곧이, 공교로이(工巧로이), 기우뚱기우뚱, 기웃, 길쭉이, 끼우뚱, 정작01
    • Root.csv: 유창03(流暢), 잠잠(潛潛), 지긋01(집안일이 ~하다), 흥성03(興盛), 들큼, 씽씽02, 알알02, 구수01, 고약01, 풍부02(豊富), 가뜬, 갸륵02, 견실02(堅實), 고불01, 구불, 급급03(急急),
    • Adjective.supplement.csv: 매스껍다, 가소롭다, 건하다01, 공교롭다
    • Noun.misc.csv: 기가헤르츠(gigahertz), 도스80(dose)
    • Conjunction.csv: 그래도
  • 項目を修正
    • Noun.supplement.name.csv: 아리스토텔레스(Aristoteles)の綴を修正, 주07(朱)の同音異義語番号を05に, 주10(周)の同音異義語番号を08に, 中国人名など項目に空白が含まれていたのを削除
    • Noun.C.csv: 정치권(政治權)の同音異義番号を02に
    • Adjective.supplement.csv: 감다の同音異義番号を04に, 모이다の同音異義番号を01に, 즐기다の同音異義番号を02に
    • Noun.supplement.csv: 칠갑01(漆甲)の漢字を追加・同音異義番号を削除, 명04/05(命)の品詞3を入れ替え, 못03の「補充」素性が「漢字」素性として記述されていたのを修正,발명01/02(發明)の品詞3をいずれも「動作」にして「補充」素性に記述を追加, 전갈자리の漢字を修正,미숙01(未熟)の同音異義番号を削除,반올림の漢字情報を修正,벽돌に漢字情報を追加,부정부패の漢字情報を修正, 연어04(鰱魚)に漢字情報を追加, 주03(主)の同音異義語番号を01に, 주04の同音異義語番号を02に+漢字情報(主)を追加, 주05(州)の同音異義語番号を03に, 주18(柱)の同音異義語番号を16に+補充情報(기둥)を追加, 주24(株)の同音異義語番号を22に+補充情報(주식)を追加, 주25(紬)の同音異義語番号を23に, 주27(註)の同音異義語番号を25に, 딸꾹질の品詞3を「動作」に, 탈02に漢字情報(頉)を追加, 별표01の漢字情報を修正(별**標**), 건사01の品詞3に「動作」を追加, 건투の品詞3に「動作」を追加, 과묵(寡默)の品詞3に「状態」を追加, 궁색01の漢字情報を修正(窮**色**), 예매(豫賣)に同音異義番号を02に, 예매01(豫買)の品詞3に「動作」を追加, 무사11(無事)の品詞3に「状態」を追加
    • Verb.supplement_1.5over.csv: 거르다01に補足情報(막걸리를 ~)を追加, 거르다02に補足情報(끼니를 ~)を追加
    • Verb.supplement_3.std.csv: 덧나다の同音異義番号を01に, 메이다の同音異義番号を02に+補足情報(메다)追加, 검다の同音異義語番号を01に, 짙다の同音異義番号を01に
    • Adverb.csv: 이리03(**이리** 오너라.)/이리04(**이리** 바쁘다.)の同音異義番号を修正, 지긋지긋02に補足情報(가난이 ~하다)を追加
    • Modifier.csv: 주03(主)の同音異義語番号を01に
    • Noun.misc.csv: 주11(周)の同音異義語番号を09に, 주24(株)の同音異義語番号を22に+補充情報(느티나무 한 ~/그루)を追加, 주26(週)の同音異義語番号を24に
    • Suffix.csv: 주31(主)の同音異義語番号を28に, 주32(酒)の同音異義語番号を29に, 맞다04を形容詞派生接尾辞に
    • Prefix.csv: 주33(駐)の同音異義語番号を30に
    • Noun.A.csv: 주26(週)の同音異義語番号を24に
    • Noun.supplement.org.csv: 주식회사 부산항보안공사(釜山港保安公社)・주식회사 인천항보안공사(仁川港保安公社)の「주식회사 」を削除
    • Root.csv: 지긋02に補足情報(나이가 ~하다)を追加, 갸륵01に補足情報(뜻이 ~하다)を追加
    • Adjective.csv: 대문짝만하다の漢字情報を修正
  • 項目を削除
    • Ending.csv: -ㄴ데다, -ㄴ데다가, -는데다, -는데다가
    • Adverb.csv: 싱싱, 이리05, 잠잠(潛潛), 자세01(仔細), 녹록01(碌碌)
    • Adjective.supplement.csv: 아니다
    • Modifier.csv: 공11
    • Noun.supplement.csv: 앞구르기, 국회의원직(國會議員職), 의원직(議員職), 국회직(國會職), 논03(論), 고정관념(固定觀念), 유창03(流暢), 탄산가스(炭酸gas), 구수01, 고약01, 재확인시키다, 풍부02(豊富), 상한제(上限制), 동부권(東部圈), 조정실장(調整室長), 지부장직(支部長職), 무력시위(武力示威), 무력행사(武力行使), 무료입장(無料入場), 긴급회의(緊急會議), 청구권자(請求權者), 임시직(臨時職), 대통령제(大統領制), 대통령직(大統領職), 대통령학(大統領學)
      • 重複分:미안(未安), 불길02(不吉), 무난(無難), 미묘02(微妙), 선언01(宣言), 시급01(時急), 심심02, 예고(豫告), 위태01(危殆), 유의04(留意), 자신만만(自信滿滿), 한가04(閑暇), 흥미진진(興味津津), 옛날01, 검찰청(檢察廳), 고지식01, 관대04(寬大), 기발03(奇拔)
    • Noun.supplement.name.csv: 신(名,重複)
    • Noun.supplement.place.csv: 소금강(小金剛,重複), 평사리(重複), 화산리(花山里/華山里,重複)
    • Noun.misc.csv: 무08に補足情報(무승부)追加
    • Verb.supplement_1.over5.csv: 물려받다(重複)
    • Root.csv: 미숙01(未熟,重複)
    • Prefix.csv: 시-(用言接頭辞)が誤って登録されていたのを削除
    • Suffix.csv: -이-(用言接尾辞)が誤って登録されていたのを削除
    • Conjunction.csv: 또한

20210116

handic-mecab-20210116_bin.zip / handic-mecab-20210116_src.tar.gz

200324 - 0.7

handic-mecab-0.7_bin.zip / handic-mecab-0.7_src.tar.gz

  • 現況:項目数 115,285,学習用データ 3,811文
  • 学習用データ追加
    • 須賀井義教『確認しながらおぼえる 韓国語基本単語帳』(朝日出版社,2019年)に掲載の例文(初級レベル,513文)
    • 연세대학교 한국어학당 편『연세한국어 읽기 1』(연세대학교 대학출판문화원,2007年)に掲載の本文(初級レベル,タイトル除く,365文)
    • 서울대학교 언어교육원『한국어 1(제2판)』(문진미디어,2005年)に掲載の本文(初級レベル,タイトル除く,233文)
  • 項目を削除
    • Modifier.csv: 가상적, 모방적, 보바리적, 부상적, 제삼, 태곳적, 팬터마임식
    • Noun.C.csv: 수도권(首都圈), 신제품(新製品)
    • Noun.misc.csv: 년생(年生, 여고 2~), 년생80(年生, 80~)
    • Noun.supplement.csv: 맨몸, 고금리(高金利), 월별01(月別), 수익률(收益率), 역외국(域外國), 신개발(新開發), 신공법(新工法), 신공업(新工業), 신과학(新科學), 신국제(新國際), 신군부(新軍部), 신그래픽(新그래픽), 신농정(新農政), 신노정(新勞政), 신모델(新모델), 신물질(新物質), 신무용(新舞踊), 신무용사(新舞踊史), 신미술(新美術), 신민속(新民俗), 신사고(新思考), 신산업(新産業), 신사회(新社會), 신세대형(新世代型), 신시장(新市場), 신인사(新人事), 신재벌(新財閥), 신정치(新政治), 신질서(新秩序), 신축비(新築費), 신풍속(新風俗), 신항만(新港灣)
    • Noun.supplement.org.csv: 정동극장(貞洞劇場)
    • Noun.supplement.place.csv: 종로1가など,数字+街を含む地名を削除(途中)
    • Verb.B.csv: 말씀드리다
    • Verb.C.csv: 낮아지다
    • Verb.supplement_1.over5.csv: 부탁드리다
  • 項目を追加
    • Adjective.csv: 요상하다02, 사사롭다, 길길다랗다, 노오랗다(노랗다)
    • Adverb.csv: 조붓이, 게슴치레(게슴츠레), 둥글둥글, 보아하니, 일찌기(일찍이)
    • Ending.csv: -너라, -나이다
    • Interjection.csv: 워리, 워어리, 저어(저05)
    • Noun.C.csv: 다소01(多少)
    • Noun.supplement.csv: 도래솔, 친소(親疏), 은원(恩怨), 증조모(曾祖母), 증조부(曾祖父), 녹음방초(綠陰芳草), 조락03(凋落), 시계열(時系列), 층운(層雲), 여노80(女奴), 재배국(栽培國), 역외01(域外), 현물환(現物換), 환차손(換差損), 선물환(先物換), 스왑(swap), 식품업(食品業), 장비업(裝備業), 관광업(觀光業), 교부금(交付金), 세입02(歲入), 갯바위, 가상적(假想敵), 모방적(毛紡績), 팬터마임, 디브이디(DVD), 영어학(英語學), 순두부찌개(순豆腐찌개), 털모자(털帽子), 별표01(별票), 정자05(井字), 기차표(汽車票), 비행기표(飛行機票), 특구(特區), 명신(名臣), 량(量), 엽기(獵奇), 유의(留意), 유향(乳香), 주화(鑄貨), 진법(進法), 집산(集散), 집체(集體), 초식(草食), 총람(總覽), 추상(秋霜), 타방(他方), 특목고(特目高), 통례(通例), 포유(哺乳), 한국사(韓國史), 해소(咳嗽▽), 향불(香불), 현전(現前), 혈류(血流), 확집(確執), 회갑연(回甲宴), 회교국(回敎國), 획분(劃分), 강대(强大), 부조리(不條理), 도시(圖示), 되새김, 등하교(登下校), 봉헌(奉獻), 신접(新接), 오용(誤用), 전신(轉身), 중언부언(重言復言), 퇴락(頹落), 항해사(航海士), 현전(現前), 태아기(胎兒期), 초혼제(招魂祭), 첫손, 가역(可逆), 결구(結句), 결미(結尾), 고자(告者), 관보(官報), 국학(國學), 균체(菌體), 극찬(極讚), 금줄(禁줄), 기득(旣得), 기정(旣定), 농학(農學), 다의(多義), 단백(蛋白), 대두박(大豆粕), 대청마루(大廳마루), 드래곤, 드레서미싱, 러닝메이트, 레지스탕스, 로마인(로마人), 르네쌍스, 리엔지니어링, 무의(無意), 무협(武俠), 물범, 배송(配送), 변전(變轉), 병졸(兵卒), 부르조아지, 북극(北極), 분망(奔忙), 불감(不感), 불호령(불號令), 비오리, 빈털털이, 사술(詐術), 사익(私益), 사훈(社訓), 삼극(三極), 삼불(三不), 서광(曙光), 서품(敍品), 세레모니, 식자(識者), 액세스, 쉬트, 인디언, 인프린팅, 시너리, 엘리뜨, 외뿔소, 세포질(細胞質), 소화관(消化管), 일시납(一時納), 월납(月納), 캐슬, 컬처, 큰며느리, 키즈, 툼, 팀웍, 파아트너, 파트론, 팰리스, 포스트마르크시즘, 프로젝터, 피그미침팬지, 필하아모니, 하이틴, 패로디, 카운트, 코디언, 주야간(晝夜間), 버라이어티(variety), 소관사(所關事), 소송법(訴訟法), 왕세자빈(王世子嬪)
    • Noun.supplement.name.csv: 스잔, 보바리, 토모미, 마이클, 유키(「姓」ではなく「名」として), 웨이, 제임스, 마리아, 스티븐, 그라스, 다운즈, 데비도우, 뒤샹, 드골, 드럭커, 라이프니쯔, 로렌츠, 맨더, 머로우, 멀룬, 멕퀘일, 모리스, 모차르트, 몬드리안, 바니, 바비지, 반즈, 벨지, 부시만, 부어스틴, 브란트, 비스마르크, 슈베르트, 슈월츠, 시라, 오펜하이머, 윌슨, 윌킨슨, 잭슨, 처칠, 츠월킨, 칼더, 케네디, 크로프트, 클라크, 타피에스, 텔러, 토플러, 파바로티, 파바로티, 페스타, 폴로, 프랭클, 프레지, 프로이트, 하워드, 하케, 해밀턴, 헤링, 헨체, 헬드, 귄터, 다니엘, 라라, 로버트, 루네, 루치아노, 리처드, 마르셀, 마르코, 매튜, 버얼, 베르너, 벤, 보리슬라프, 빌리, 샤를르, 안토니, 알렉산더, 앨빈, 에드워드, 윈스턴, 윌리엄, 제리, 조안, 죤, 줄리란, 줄리안, 찰스, 콘라드, 클라우스, 토니, 프레드릭, 프리, 피터, 한스, 헬렌, 건희, 기심, 나루히토, 낙원, 남선, 도철, 만태, 맹국, 몽헌, 병해, 보고, 본무, 봉원, 부용, 삼국, 세득, 영묵, 완서, 우복, 우중, 월례, 은상, 응문, 이국, 인직, 인탁, 일국, 자원, 재서, 주범, 중건, 지풍, 철곤, 항섭, 혜순, 강전탁야, 걸리버, 꼭또, 노아, 노자(老子), 다산(茶山), 대하전웅, 데카르트, 도미, 루이지, 릴리스, 마르크스, 마이더스, 매천(梅泉), 모하메트, 베드로, 베케트, 비틀즈, 빠스깔, 사뮤엘, 석가모니(釋迦牟尼), 셰익스피어, 스칼파로, 신라사부로(新羅三郞), 아담, 아랑, 아리스트텔레스, 아퀴나스, 알라딘, 야누스, 연암(燕巖), 예수, 오스카르, 외젠느, 이브, 이오네스꼬, 이오네스꼬나, 칭기즈칸, 칸트, 콜롬보, 프로메테우스, 헤겔, 마리, 앙리
    • Noun.supplement.org.csv: 미래통합당(未來統合黨), 미래한국당(未來韓國黨), 열린민주당(열린民主黨), 자유공화당(自由共和黨), 우리공화당(우리共和黨), 이대(梨大), 문화체육부(文化體育部), 식량청(食糧廳), 흥사단(興士團), 경북중학교(慶北中學校), 교보(敎保), 국립국어연구원(國立國語硏究院), 금호미술관(錦湖美術館), 기아써비스(起亞써비스), 나침반(羅針盤), 농수성(農水省), 닐슨사(닐슨社), 닛세, 대림그룹(大林그룹), 대림요업(大林窯業), 대우그룹(大宇그룹), 대한교육보험(大韓敎育保險), 대한항공(大韓航空), 덴츠, 동방문화진흥회(東方文化振興會), 동아출판사(東亞出版社), 동양그룹(東洋그룹), 동양제과(東洋製菓), 동연, 라인정밀(라인精密), 럭키개발(럭키開發), 럭키금성그룹(럭키金星그룹), 롯데그룹, 마이크로소프트, 명성서커스단(명성서커스團), 미주전자(美洲電子), 사법연수원(司法硏修院), 산요, 삼성그룹(三星구릅), 삼성그룹(三星그룹), 삼성물산(三星物産), 삼성사관학교(三星士官學校), 삼성전자(三星電子), 삼성중공업(三星重工業), 서울셀렉션, 서울지하철(서울地下鐵), 선경건설(鮮京建設), 세계교회협의회(世界敎會協議會), 소니, 수미다전기, 쌍용그룹(雙龍그룹), 쌍용양회(雙龍洋灰), 안국화재(安國火災), 알라딘, 예일대학교(예일大學校), 오스카, 웅진닷컴, 육군대학(陸軍大學), 일본광고주협회(日本廣告主協會), 전경련(全經聯), 전자신문사(電子新聞社), 전통(電通), 제록스사(제록스社), 제일제당(第一製糖), 중앙국민학교(中央國民學校), 탠디, 포드, 하버드대학교(하버드大學校), 한국동경전자(韓國東京電子), 한국동광(韓國銅鑛), 한국소니사(韓國소니社), 한국언론학회(韓國言論學會), 한국와카사(韓國와카사), 현대상선(現代商船), 혜지원, 명덕국민학교(명덕國民學校), 제록스(Xerox)
    • Noun.supplement.place.csv: 남산타워(南山타워), 대한극장(大韓劇場), 충무로(忠武路), 태릉사격장(泰陵射擊場), 신촌(新村), 정동극장(貞洞劇場), 동해안(東海岸), 해운대(海雲臺), 당나라(唐나라), 백제국(百濟國), 백제왕국(百濟王國), 스키타이, 아메리카02, 유고09, 유고슬라비아, 보문단지(普門團地), 선재미술관(선재美術館), 코엑스(COEX), 마산항(馬山港), 파주군(坡州郡), 진해(鎭海), 창녕(昌寧), 합천(陜川)
    • Noun.supplement.proper.csv: 독립신문(獨立新聞), 매천야록(梅泉野錄), 몽유도원도(夢遊桃源圖), 서편제(西便制/영화 제목), 쉬리(영화 제목), 오아시스(영화 제목), 주역02(周易), 창세기(創世記)
    • Prefinal.csv: 〈謙譲〉の接尾辞(-삽-, -옵-, -잡-)
    • Root.csv: 무쌍(無雙), 드라마틱, 떠들석, 무결(無缺), 뻑적지근
    • Suffix.csv: 드리다80(差し上げる:動詞派生接尾辞)
    • Symbol.csv: -(マイナス記号:世宗タグSW)
    • Verb.supplement_3.std.csv: 헤매이다(헤매다)
  • 項目を修正
    • Noun.C.csv: 근거の品詞3を「動作」に修正
    • Noun.supplement.csv: 정확01の品詞3を「状態」に,수발01/수발02(受發)の品詞3を「動作」に修正.제삼の漢字を修正
    • Noun.supplement.org.csv: デパート名の漢字表記が統合型ハングルで記述されていたのを修正
    • Noun.supplement.place.csv: 인사동(仁寺洞)がソウルの観光地としての「地名」と慶尚南道昌原市の行政区画としての「都市名」とで重複していたのを,「都市名」に単一化し,漢字表記を追加
    • Noun.supplement.proper.csv: 新聞名の漢字表記が統合型ハングルで記述されていたのを修正

180428 - 0.6

handic-mecab-0.6_bin.zip / handic-mecab-0.6_src.tar.gz

  • 現況:項目数 114,863,学習用データ 2,700文
  • 学習用データ追加(冒頭の100文)
    • BTHO0129.txt: 삶의 결 살림의 질
  • 項目を削除
    • Verb.supplement_1.over5.csv: 모아지다
    • Noun.supplement.csv: 홀짝이다, 대보름, 대보름날, 생솔가지, 운동권, 다듬이질, 장꾼, 마다02(XRと重複), 공산권, 충전식, 심부전증, 침해죄, 최첨단(最尖端), 마취과(痲醉科), 재승격(再昇格), 성장률(成長率), 바닥권, 미신고자(未申告者), 대주주(大株主), 증가율(增加率), 총학생회(總學生會), 재구성(再構成)
    • Adjective.csv:
    • Modifier.csv:
    • Verb.B.csv: 세워지다, 느껴지다, 알려지다, 높아지다
    • Noun.B.csv: 대도시(大都市), 대기업(大企業)
    • Noun.C.csv: 성적01(性的), 신세대(新世代)
    • Noun.supplement.place.csv: 종로1가など,数字+街を含む地名を削除(途中)
  • 項目を追加
    • Ending.csv: 모(사투리 "면"), 키(하기)
    • Noun.A.csv: 월02(月)
    • Noun.misc.csv: 인조80(人組)
    • Noun.supplement.csv: 3·1절, 절후02(節候), 나발통, 함석, 달집01, 방화죄(放火罪), 산림법(山林法), 원뿔통(圓뿔통), 장터거리(場터거리), 피붙이, 뜸마을, 아랫동, 비손, 짚불, 딱총(딱銃), 불꽃놀이, 액02(厄), 꽃샘, 연녹색/연록색(軟綠色), 연록(軟綠), 만산02(滿山), 정한02(情恨), 개여울, 재취02(再娶), 의붓딸, 의붓아들, 의붓아범, 의붓아비, 의붓어머니, 의붓어멈, 의붓어미, 의붓자식(의붓子息), 선병질(腺病質), 위채, 마소, 반타작(半打作), 청상07(廳上), 標準国語大辞典の〈동물〉カテゴリから968項目, 여필종부(女必從夫), 인종05(忍從), 모티브, 곡마단(曲馬團), 고깔모자, 재주넘기, 읍민(邑民), 곡예사(曲藝師), 명견(名犬), 외발, 요절03(腰折/腰絕), 선전원(宣傳員), 장27(場/시장), 애조02(哀調), 공중그네, 정인04(情人), 제설차(除雪車), 적십자(赤十字), 심부전(心不全), 화기06(花器), 요식02(料食), 시약03(試藥), 팔모정(八모亭), 국교80(國校=국민학교), 구름사다리, 늑목(肋木), 간이링(簡易링), 제당03(製糖), 니켈(nickel), 밀감(蜜柑), 경81(經=경제), 도크(dock), 신고자(申告者), 구주10(舊株), 장세03(場勢), 내강01(內剛), 외유내강(外柔內剛), 외유02(外柔), 첨가제02(添加劑), 활석분(滑石粉), 거래소(去來所), 유종80(油種), 국고국장(國庫局長), 인두세(人頭稅), 광공업체(鑛工業體), 주세법(酒稅法), 청주03(淸酒), 과실주(果實酒), 백송01(白松), 엽록소(葉綠素), 신부전(腎不全), 한계선(限界線), 분단국가(分斷國家), 국고금(國庫金), 일평균(日平均), 당행, 국공채(國公債), 동월02(同月), 하회02(下廻), 전월02(前月)
    • Noun.supplement.name.csv: 소월03(素月), 윤섭, 범직, 칼, 립켄, 마크, 맥과이어, 파이잘, 아브다오, 세달, 대처(Thatcher), 국병, 연란, 숀, 팬
    • Noun.supplement.place.csv: 호서02(湖西), 기호05(畿湖), 해서01(海西), 선달바우산, 레닌그라드, 수안보(水安堡), 코리아(Korea), 서독01(西獨), 엑셀
    • Verb.supplement_1.over5.csv: 신나다
    • Verb.supplement_3.std.csv: 홀짝이다, 맹글다(사투리 "만들다"), 찌다06(솔가지를 ~), 킬킬대다
    • Noun.supplement.proper.csv: 진달래꽃02, 산유화01(山有花),접동새01, 마그레비, 천황배(天皇杯), 우루과이라운드(Uruguay Round), 데미렐, 태릉사격장(泰陵射擊場)
    • Noun.supplement.org.csv: 행정안전부/행안부, 중소벤처기업부/중기부, 과학기술정보통신부/과기정통부, 韓国の政党名72項目, 적십자(赤十字), 행림대(杏林大), 롯데리아, 사조참치, 동신떡갈비, 중대(중앙대 약칭), 대명레저산업, 한국소비자보호원, 소보원(한국소비자보호원 약칭), 유니세프(UNICEF), 유러펀드(Euro Fund), 상공부(商工部), 메츠(Mets), 미국프로테니스협회, 삼성(三星), 현대(現代), 국제테니스연맹, 프뤼겔스, 전일공 (全日空), 경단협(經團協), 해태, 고합, 대우(大宇), 한라(漢拏), 배명, 현대자동차(現代自動車), 교통부(交通部), 안전국(安全局), 企業グループ名38項目, 재무부(財務部), 동자부(動資部), 롯데칠성, 문화방송, 한국방송, 에스비에스(SBS)
    • Noun.numeral.csv: 시오(십리고 시오리고...)
    • Prefix.csv: 먹03(구름)
    • Suffix.csv: 급06(級)
    • Adjective.supplement.csv: 다숩다, 다습다, 애운하다
    • Adverb.csv: 휘뚜루마뚜루, 천상(天常)
    • Symbol.csv: 単位記号などを追加, ▴
  • 項目の修正
    • Noun.supplement.csv, Noun.supplement.place.csv: 관서03(關西)/관북(關北)/관동04(關東)/영서05(嶺西)を固有名詞に修正
    • Noun.supplement.csv: 의붓동생の漢字表記を修正,길쌈の品詞情報を修正(品詞3を「動作」に), 요절01(夭折)の同音異義番号を修正
    • Noun.supplement.place.csv: 경기02(京畿)の同音異義番号を追加
    • Noun.C.csv, Noun.proper.csv: 호남02(湖南)を固有名詞に修正
    • Noun.supplement.org.csv: 간월사지/감산사지の漢字表記を修正
    • Verb.supplement_1.over5.csv: 깁다の活用情報と項目を修正
    • Verb.supplement_3.std.csv: 덧깁다/짜깁다の活用情報と項目を修正.설다の同音異義番号01を追加
    • Adjective.csv: 설다01の同音異義番号を02に修正し,第Ⅱ語基の形に설으を追加(낯설고 물 설은 땅)
    • Adjective.supplement.csv: 물설다の第Ⅱ語基の形に물설으を追加
    • Suffix.csv: 질11(가위, 손가락...)の品詞情報を修正(品詞3を「動作」に)
    • rewrite.def: -률04/-율04(率)を一つの項目としてみなすよう記述

170529 - 0.5

handic-mecab-0.5_bin.zip / handic-mecab-0.5_src.tar.gz

本バージョンより,ソースを公開しました.インストールについてはHanDicのインストールを参照してください.

  • 現況:項目数 113,471,学習用データ 2,600文
  • 学習用データ追加(冒頭の100文)
    • BTEO0081.txt: 시간속의 도적
    • BTBE0237.txt: 금융 97년 1월호(雑誌)
  • 項目を削除
    • Verb.supplement_1.over5.csv: 붙여지다, 유명해지다, 따뜻해지다
    • Noun.supplement.csv: 무중력, 불성실, 불필요, 재편성, 지향점, 결정권, 통제권, 중요시
    • Adjective.csv: 에로틱하다
    • Modifier.csv: 독점화
    • Verb.C.csv: 여겨지다
    • Noun.C.csv: 소규모, 국제화
  • 項目を追加
    • Ending.csv: ㄹ테니까/EC, 리만큼/EC, 토록/EC
    • Noun.supplement.csv: 에로틱, 의총05, 극대01, 부제09(部制), 업적주의(業績主義), 불식04(拂拭), 공동선01(共同善)
    • Root.csv: 획일(劃一)
    • Verb.supplement_3.std.csv: 끝내주다/VV
    • Noun.supplement.org.csv: 조선노동당, 조선로동당, 노동당, 로동당, 세계무역기구, 경제협력개발기구, 스탭(staff)
    • Symbol.csv: +/SW, ■/SW
  • 項目の修正
    • Noun.supplement.csv: 살색に漢字表記を追加, 성실02(誠實)の品詞3を「状態」に修正
    • Noun.supplement.csv, Noun.supplement.place.csv: 영동03(嶺東)を固有名詞に修正
    • Noun.B.csv: 수염04の同音異義番号を03に修正
    • Noun.C.csv, Noun.proper.csv: 영남(嶺南)を固有名詞に修正

160508 - 0.4

handic-mecab-0.4_bin.zip

  • 現況:項目数 113,474,学習用データ 2,400文
  • 学習用データ追加(冒頭の100文)
    • BTEO0088.txt: 해남 가는 길
  • 単語を追加
    • Noun.supplement.csv: 동파05, 이동01, 이서03
    • Noun.supplement.place.csv: 충청(忠淸),韓国の空港(Wikipedia 분류:대한민국의 공항),北朝鮮の地名(북한네트/북한 지리を参照,漢字表記含む)
    • Noun.misc.csv: 터02に指定詞がついた形を「指定詞融合」として追加
    • Verb.supplement_3.std.csv: 어떡하다(어떡하/어떡해/어떡하여/어떡허) をVVとして追加
    • Ending.csv: -ㄴ데다, -는데다, -는데다가, -자니を追加
  • 項目の修正
    • Root.csv, Noun.supplement.csv: 다정01(多情)を語根から普通名詞に修正
    • Verb.B.csv: 머무르다の活用情報を修正
    • Noun.B.csv: 배구06の同音異義語番号を05に修正
    • Adverb.csv, Modifier.csv: 그만01を副詞から冠形詞に修正
    • Adjective.supplement.csv: 一部の項目で「表層形」(単語の項目そのもの)が統合型ハングルで,「出現形」が字母で記述されていたのを修正
    • Noun.supplement.place.csv: 外国の河川名などの漢字表記が統合型ハングルで記述されていたのを修正
    • Ending.csv, Ending.Particle.csv, Suffix.csv, Verb.supplement_3.std.csv: 一部の項目で「表層形」が統合型ハングルで記述されていたのを修正
  • 項目の削除
    • Noun.supplement.csv: 농사꾼, 추억거리, 동일계
    • Noun.supplement.place.csv: 都市の一部(市)で重複を削除
    • Verb.supplement_1.over5.csv: 맑아지다を削除

151216 - 0.3

handic-mecab-0.3_bin.zip

151104 - 0.2

handic-mecab-0.2_bin.zip

  • 外来語の追加(国語院外来語資料から一部のみ)
  • 接頭辞を含む語を分析して削除
  • 誤記の修正
  • 項目数 106,823

150518 - 0.1

handic-mecab-0.1_bin.zip