diff options
Diffstat (limited to 'themes/CodeIT/assets/lib/lunr/lunr.TinySegmenter.js')
-rw-r--r-- | themes/CodeIT/assets/lib/lunr/lunr.TinySegmenter.js | 1530 |
1 files changed, 1530 insertions, 0 deletions
diff --git a/themes/CodeIT/assets/lib/lunr/lunr.TinySegmenter.js b/themes/CodeIT/assets/lib/lunr/lunr.TinySegmenter.js new file mode 100644 index 0000000..935cd8f --- /dev/null +++ b/themes/CodeIT/assets/lib/lunr/lunr.TinySegmenter.js @@ -0,0 +1,1530 @@ +/** + * export the module via AMD, CommonJS or as a browser global + * Export code from https://github.com/umdjs/umd/blob/master/returnExports.js + */ +(function (root, factory) { + if (typeof define === "function" && define.amd) { + // AMD. Register as an anonymous module. + define(factory); + } else if (typeof exports === "object") { + /** + * Node. Does not work with strict CommonJS, but + * only CommonJS-like environments that support module.exports, + * like Node. + */ + module.exports = factory(); + } else { + // Browser globals (root is window) + factory()(root.lunr); + } +})(this, function () { + /** + * Just return a value to define the module export. + * This example returns an object, but the module + * can return a function as the exported value. + */ + + return function (lunr) { + // TinySegmenter 0.1 -- Super compact Japanese tokenizer in Javascript + // (c) 2008 Taku Kudo <taku@chasen.org> + // TinySegmenter is freely distributable under the terms of a new BSD licence. + // For details, see http://chasen.org/~taku/software/TinySegmenter/LICENCE.txt + + function TinySegmenter() { + var patterns = { + "[一二三四五六七八九十百千万億兆]": "M", + "[一-龠々〆ヵヶ]": "H", + "[ぁ-ん]": "I", + "[ァ-ヴーア-ン゙ー]": "K", + "[a-zA-Za-zA-Z]": "A", + "[0-90-9]": "N", + }; + this.chartype_ = []; + for (var i in patterns) { + var regexp = new RegExp(i); + this.chartype_.push([regexp, patterns[i]]); + } + + this.BIAS__ = -332; + this.BC1__ = { HH: 6, II: 2461, KH: 406, OH: -1378 }; + this.BC2__ = { + AA: -3267, + AI: 2744, + AN: -878, + HH: -4070, + HM: -1711, + HN: 4012, + HO: 3761, + IA: 1327, + IH: -1184, + II: -1332, + IK: 1721, + IO: 5492, + KI: 3831, + KK: -8741, + MH: -3132, + MK: 3334, + OO: -2920, + }; + this.BC3__ = { + HH: 996, + HI: 626, + HK: -721, + HN: -1307, + HO: -836, + IH: -301, + KK: 2762, + MK: 1079, + MM: 4034, + OA: -1652, + OH: 266, + }; + this.BP1__ = { BB: 295, OB: 304, OO: -125, UB: 352 }; + this.BP2__ = { BO: 60, OO: -1762 }; + this.BQ1__ = { + BHH: 1150, + BHM: 1521, + BII: -1158, + BIM: 886, + BMH: 1208, + BNH: 449, + BOH: -91, + BOO: -2597, + OHI: 451, + OIH: -296, + OKA: 1851, + OKH: -1020, + OKK: 904, + OOO: 2965, + }; + this.BQ2__ = { + BHH: 118, + BHI: -1159, + BHM: 466, + BIH: -919, + BKK: -1720, + BKO: 864, + OHH: -1139, + OHM: -181, + OIH: 153, + UHI: -1146, + }; + this.BQ3__ = { + BHH: -792, + BHI: 2664, + BII: -299, + BKI: 419, + BMH: 937, + BMM: 8335, + BNN: 998, + BOH: 775, + OHH: 2174, + OHM: 439, + OII: 280, + OKH: 1798, + OKI: -793, + OKO: -2242, + OMH: -2402, + OOO: 11699, + }; + this.BQ4__ = { + BHH: -3895, + BIH: 3761, + BII: -4654, + BIK: 1348, + BKK: -1806, + BMI: -3385, + BOO: -12396, + OAH: 926, + OHH: 266, + OHK: -2036, + ONN: -973, + }; + this.BW1__ = { + ",と": 660, + ",同": 727, + B1あ: 1404, + B1同: 542, + "、と": 660, + "、同": 727, + "」と": 1682, + あっ: 1505, + いう: 1743, + いっ: -2055, + いる: 672, + うし: -4817, + うん: 665, + から: 3472, + がら: 600, + こう: -790, + こと: 2083, + こん: -1262, + さら: -4143, + さん: 4573, + した: 2641, + して: 1104, + すで: -3399, + そこ: 1977, + それ: -871, + たち: 1122, + ため: 601, + った: 3463, + つい: -802, + てい: 805, + てき: 1249, + でき: 1127, + です: 3445, + では: 844, + とい: -4915, + とみ: 1922, + どこ: 3887, + ない: 5713, + なっ: 3015, + など: 7379, + なん: -1113, + にし: 2468, + には: 1498, + にも: 1671, + に対: -912, + の一: -501, + の中: 741, + ませ: 2448, + まで: 1711, + まま: 2600, + まる: -2155, + やむ: -1947, + よっ: -2565, + れた: 2369, + れで: -913, + をし: 1860, + を見: 731, + 亡く: -1886, + 京都: 2558, + 取り: -2784, + 大き: -2604, + 大阪: 1497, + 平方: -2314, + 引き: -1336, + 日本: -195, + 本当: -2423, + 毎日: -2113, + 目指: -724, + B1あ: 1404, + B1同: 542, + "」と": 1682, + }; + this.BW2__ = { + "..": -11822, + 11: -669, + "――": -5730, + "−−": -13175, + いう: -1609, + うか: 2490, + かし: -1350, + かも: -602, + から: -7194, + かれ: 4612, + がい: 853, + がら: -3198, + きた: 1941, + くな: -1597, + こと: -8392, + この: -4193, + させ: 4533, + され: 13168, + さん: -3977, + しい: -1819, + しか: -545, + した: 5078, + して: 972, + しな: 939, + その: -3744, + たい: -1253, + たた: -662, + ただ: -3857, + たち: -786, + たと: 1224, + たは: -939, + った: 4589, + って: 1647, + っと: -2094, + てい: 6144, + てき: 3640, + てく: 2551, + ては: -3110, + ても: -3065, + でい: 2666, + でき: -1528, + でし: -3828, + です: -4761, + でも: -4203, + とい: 1890, + とこ: -1746, + とと: -2279, + との: 720, + とみ: 5168, + とも: -3941, + ない: -2488, + なが: -1313, + など: -6509, + なの: 2614, + なん: 3099, + にお: -1615, + にし: 2748, + にな: 2454, + によ: -7236, + に対: -14943, + に従: -4688, + に関: -11388, + のか: 2093, + ので: -7059, + のに: -6041, + のの: -6125, + はい: 1073, + はが: -1033, + はず: -2532, + ばれ: 1813, + まし: -1316, + まで: -6621, + まれ: 5409, + めて: -3153, + もい: 2230, + もの: -10713, + らか: -944, + らし: -1611, + らに: -1897, + りし: 651, + りま: 1620, + れた: 4270, + れて: 849, + れば: 4114, + ろう: 6067, + われ: 7901, + を通: -11877, + んだ: 728, + んな: -4115, + 一人: 602, + 一方: -1375, + 一日: 970, + 一部: -1051, + 上が: -4479, + 会社: -1116, + 出て: 2163, + 分の: -7758, + 同党: 970, + 同日: -913, + 大阪: -2471, + 委員: -1250, + 少な: -1050, + 年度: -8669, + 年間: -1626, + 府県: -2363, + 手権: -1982, + 新聞: -4066, + 日新: -722, + 日本: -7068, + 日米: 3372, + 曜日: -601, + 朝鮮: -2355, + 本人: -2697, + 東京: -1543, + 然と: -1384, + 社会: -1276, + 立て: -990, + 第に: -1612, + 米国: -4268, + "11": -669, + }; + this.BW3__ = { + あた: -2194, + あり: 719, + ある: 3846, + "い.": -1185, + "い。": -1185, + いい: 5308, + いえ: 2079, + いく: 3029, + いた: 2056, + いっ: 1883, + いる: 5600, + いわ: 1527, + うち: 1117, + うと: 4798, + えと: 1454, + "か.": 2857, + "か。": 2857, + かけ: -743, + かっ: -4098, + かに: -669, + から: 6520, + かり: -2670, + "が,": 1816, + "が、": 1816, + がき: -4855, + がけ: -1127, + がっ: -913, + がら: -4977, + がり: -2064, + きた: 1645, + けど: 1374, + こと: 7397, + この: 1542, + ころ: -2757, + さい: -714, + さを: 976, + "し,": 1557, + "し、": 1557, + しい: -3714, + した: 3562, + して: 1449, + しな: 2608, + しま: 1200, + "す.": -1310, + "す。": -1310, + する: 6521, + "ず,": 3426, + "ず、": 3426, + ずに: 841, + そう: 428, + "た.": 8875, + "た。": 8875, + たい: -594, + たの: 812, + たり: -1183, + たる: -853, + "だ.": 4098, + "だ。": 4098, + だっ: 1004, + った: -4748, + って: 300, + てい: 6240, + てお: 855, + ても: 302, + です: 1437, + でに: -1482, + では: 2295, + とう: -1387, + とし: 2266, + との: 541, + とも: -3543, + どう: 4664, + ない: 1796, + なく: -903, + など: 2135, + "に,": -1021, + "に、": -1021, + にし: 1771, + にな: 1906, + には: 2644, + "の,": -724, + "の、": -724, + の子: -1000, + "は,": 1337, + "は、": 1337, + べき: 2181, + まし: 1113, + ます: 6943, + まっ: -1549, + まで: 6154, + まれ: -793, + らし: 1479, + られ: 6820, + るる: 3818, + "れ,": 854, + "れ、": 854, + れた: 1850, + れて: 1375, + れば: -3246, + れる: 1091, + われ: -605, + んだ: 606, + んで: 798, + カ月: 990, + 会議: 860, + 入り: 1232, + 大会: 2217, + 始め: 1681, + 市: 965, + 新聞: -5055, + "日,": 974, + "日、": 974, + 社会: 2024, + カ月: 990, + }; + this.TC1__ = { + AAA: 1093, + HHH: 1029, + HHM: 580, + HII: 998, + HOH: -390, + HOM: -331, + IHI: 1169, + IOH: -142, + IOI: -1015, + IOM: 467, + MMH: 187, + OOI: -1832, + }; + this.TC2__ = { + HHO: 2088, + HII: -1023, + HMM: -1154, + IHI: -1965, + KKH: 703, + OII: -2649, + }; + this.TC3__ = { + AAA: -294, + HHH: 346, + HHI: -341, + HII: -1088, + HIK: 731, + HOH: -1486, + IHH: 128, + IHI: -3041, + IHO: -1935, + IIH: -825, + IIM: -1035, + IOI: -542, + KHH: -1216, + KKA: 491, + KKH: -1217, + KOK: -1009, + MHH: -2694, + MHM: -457, + MHO: 123, + MMH: -471, + NNH: -1689, + NNO: 662, + OHO: -3393, + }; + this.TC4__ = { + HHH: -203, + HHI: 1344, + HHK: 365, + HHM: -122, + HHN: 182, + HHO: 669, + HIH: 804, + HII: 679, + HOH: 446, + IHH: 695, + IHO: -2324, + IIH: 321, + III: 1497, + IIO: 656, + IOO: 54, + KAK: 4845, + KKA: 3386, + KKK: 3065, + MHH: -405, + MHI: 201, + MMH: -241, + MMM: 661, + MOM: 841, + }; + this.TQ1__ = { + BHHH: -227, + BHHI: 316, + BHIH: -132, + BIHH: 60, + BIII: 1595, + BNHH: -744, + BOHH: 225, + BOOO: -908, + OAKK: 482, + OHHH: 281, + OHIH: 249, + OIHI: 200, + OIIH: -68, + }; + this.TQ2__ = { BIHH: -1401, BIII: -1033, BKAK: -543, BOOO: -5591 }; + this.TQ3__ = { + BHHH: 478, + BHHM: -1073, + BHIH: 222, + BHII: -504, + BIIH: -116, + BIII: -105, + BMHI: -863, + BMHM: -464, + BOMH: 620, + OHHH: 346, + OHHI: 1729, + OHII: 997, + OHMH: 481, + OIHH: 623, + OIIH: 1344, + OKAK: 2792, + OKHH: 587, + OKKA: 679, + OOHH: 110, + OOII: -685, + }; + this.TQ4__ = { + BHHH: -721, + BHHM: -3604, + BHII: -966, + BIIH: -607, + BIII: -2181, + OAAA: -2763, + OAKK: 180, + OHHH: -294, + OHHI: 2446, + OHHO: 480, + OHIH: -1573, + OIHH: 1935, + OIHI: -493, + OIIH: 626, + OIII: -4007, + OKAK: -8156, + }; + this.TW1__ = { につい: -4681, 東京都: 2026 }; + this.TW2__ = { + ある程: -2049, + いった: -1256, + ころが: -2434, + しょう: 3873, + その後: -4430, + だって: -1049, + ていた: 1833, + として: -4657, + ともに: -4517, + もので: 1882, + 一気に: -792, + 初めて: -1512, + 同時に: -8097, + 大きな: -1255, + 対して: -2721, + 社会党: -3216, + }; + this.TW3__ = { + いただ: -1734, + してい: 1314, + として: -4314, + につい: -5483, + にとっ: -5989, + に当た: -6247, + "ので,": -727, + "ので、": -727, + のもの: -600, + れから: -3752, + 十二月: -2287, + }; + this.TW4__ = { + "いう.": 8576, + "いう。": 8576, + からな: -2348, + してい: 2958, + "たが,": 1516, + "たが、": 1516, + ている: 1538, + という: 1349, + ました: 5543, + ません: 1097, + ようと: -4258, + よると: 5865, + }; + this.UC1__ = { A: 484, K: 93, M: 645, O: -505 }; + this.UC2__ = { A: 819, H: 1059, I: 409, M: 3987, N: 5775, O: 646 }; + this.UC3__ = { A: -1370, I: 2311 }; + this.UC4__ = { + A: -2643, + H: 1809, + I: -1032, + K: -3450, + M: 3565, + N: 3876, + O: 6646, + }; + this.UC5__ = { H: 313, I: -1238, K: -799, M: 539, O: -831 }; + this.UC6__ = { H: -506, I: -253, K: 87, M: 247, O: -387 }; + this.UP1__ = { O: -214 }; + this.UP2__ = { B: 69, O: 935 }; + this.UP3__ = { B: 189 }; + this.UQ1__ = { + BH: 21, + BI: -12, + BK: -99, + BN: 142, + BO: -56, + OH: -95, + OI: 477, + OK: 410, + OO: -2422, + }; + this.UQ2__ = { BH: 216, BI: 113, OK: 1759 }; + this.UQ3__ = { + BA: -479, + BH: 42, + BI: 1913, + BK: -7198, + BM: 3160, + BN: 6427, + BO: 14761, + OI: -827, + ON: -3212, + }; + this.UW1__ = { + ",": 156, + "、": 156, + "「": -463, + あ: -941, + う: -127, + が: -553, + き: 121, + こ: 505, + で: -201, + と: -547, + ど: -123, + に: -789, + の: -185, + は: -847, + も: -466, + や: -470, + よ: 182, + ら: -292, + り: 208, + れ: 169, + を: -446, + ん: -137, + "・": -135, + 主: -402, + 京: -268, + 区: -912, + 午: 871, + 国: -460, + 大: 561, + 委: 729, + 市: -411, + 日: -141, + 理: 361, + 生: -408, + 県: -386, + 都: -718, + "「": -463, + "・": -135, + }; + this.UW2__ = { + ",": -829, + "、": -829, + 〇: 892, + "「": -645, + "」": 3145, + あ: -538, + い: 505, + う: 134, + お: -502, + か: 1454, + が: -856, + く: -412, + こ: 1141, + さ: 878, + ざ: 540, + し: 1529, + す: -675, + せ: 300, + そ: -1011, + た: 188, + だ: 1837, + つ: -949, + て: -291, + で: -268, + と: -981, + ど: 1273, + な: 1063, + に: -1764, + の: 130, + は: -409, + ひ: -1273, + べ: 1261, + ま: 600, + も: -1263, + や: -402, + よ: 1639, + り: -579, + る: -694, + れ: 571, + を: -2516, + ん: 2095, + ア: -587, + カ: 306, + キ: 568, + ッ: 831, + 三: -758, + 不: -2150, + 世: -302, + 中: -968, + 主: -861, + 事: 492, + 人: -123, + 会: 978, + 保: 362, + 入: 548, + 初: -3025, + 副: -1566, + 北: -3414, + 区: -422, + 大: -1769, + 天: -865, + 太: -483, + 子: -1519, + 学: 760, + 実: 1023, + 小: -2009, + 市: -813, + 年: -1060, + 強: 1067, + 手: -1519, + 揺: -1033, + 政: 1522, + 文: -1355, + 新: -1682, + 日: -1815, + 明: -1462, + 最: -630, + 朝: -1843, + 本: -1650, + 東: -931, + 果: -665, + 次: -2378, + 民: -180, + 気: -1740, + 理: 752, + 発: 529, + 目: -1584, + 相: -242, + 県: -1165, + 立: -763, + 第: 810, + 米: 509, + 自: -1353, + 行: 838, + 西: -744, + 見: -3874, + 調: 1010, + 議: 1198, + 込: 3041, + 開: 1758, + 間: -1257, + "「": -645, + "」": 3145, + ッ: 831, + ア: -587, + カ: 306, + キ: 568, + }; + this.UW3__ = { + ",": 4889, + 1: -800, + "−": -1723, + "、": 4889, + 々: -2311, + 〇: 5827, + "」": 2670, + "〓": -3573, + あ: -2696, + い: 1006, + う: 2342, + え: 1983, + お: -4864, + か: -1163, + が: 3271, + く: 1004, + け: 388, + げ: 401, + こ: -3552, + ご: -3116, + さ: -1058, + し: -395, + す: 584, + せ: 3685, + そ: -5228, + た: 842, + ち: -521, + っ: -1444, + つ: -1081, + て: 6167, + で: 2318, + と: 1691, + ど: -899, + な: -2788, + に: 2745, + の: 4056, + は: 4555, + ひ: -2171, + ふ: -1798, + へ: 1199, + ほ: -5516, + ま: -4384, + み: -120, + め: 1205, + も: 2323, + や: -788, + よ: -202, + ら: 727, + り: 649, + る: 5905, + れ: 2773, + わ: -1207, + を: 6620, + ん: -518, + ア: 551, + グ: 1319, + ス: 874, + ッ: -1350, + ト: 521, + ム: 1109, + ル: 1591, + ロ: 2201, + ン: 278, + "・": -3794, + 一: -1619, + 下: -1759, + 世: -2087, + 両: 3815, + 中: 653, + 主: -758, + 予: -1193, + 二: 974, + 人: 2742, + 今: 792, + 他: 1889, + 以: -1368, + 低: 811, + 何: 4265, + 作: -361, + 保: -2439, + 元: 4858, + 党: 3593, + 全: 1574, + 公: -3030, + 六: 755, + 共: -1880, + 円: 5807, + 再: 3095, + 分: 457, + 初: 2475, + 別: 1129, + 前: 2286, + 副: 4437, + 力: 365, + 動: -949, + 務: -1872, + 化: 1327, + 北: -1038, + 区: 4646, + 千: -2309, + 午: -783, + 協: -1006, + 口: 483, + 右: 1233, + 各: 3588, + 合: -241, + 同: 3906, + 和: -837, + 員: 4513, + 国: 642, + 型: 1389, + 場: 1219, + 外: -241, + 妻: 2016, + 学: -1356, + 安: -423, + 実: -1008, + 家: 1078, + 小: -513, + 少: -3102, + 州: 1155, + 市: 3197, + 平: -1804, + 年: 2416, + 広: -1030, + 府: 1605, + 度: 1452, + 建: -2352, + 当: -3885, + 得: 1905, + 思: -1291, + 性: 1822, + 戸: -488, + 指: -3973, + 政: -2013, + 教: -1479, + 数: 3222, + 文: -1489, + 新: 1764, + 日: 2099, + 旧: 5792, + 昨: -661, + 時: -1248, + 曜: -951, + 最: -937, + 月: 4125, + 期: 360, + 李: 3094, + 村: 364, + 東: -805, + 核: 5156, + 森: 2438, + 業: 484, + 氏: 2613, + 民: -1694, + 決: -1073, + 法: 1868, + 海: -495, + 無: 979, + 物: 461, + 特: -3850, + 生: -273, + 用: 914, + 町: 1215, + 的: 7313, + 直: -1835, + 省: 792, + 県: 6293, + 知: -1528, + 私: 4231, + 税: 401, + 立: -960, + 第: 1201, + 米: 7767, + 系: 3066, + 約: 3663, + 級: 1384, + 統: -4229, + 総: 1163, + 線: 1255, + 者: 6457, + 能: 725, + 自: -2869, + 英: 785, + 見: 1044, + 調: -562, + 財: -733, + 費: 1777, + 車: 1835, + 軍: 1375, + 込: -1504, + 通: -1136, + 選: -681, + 郎: 1026, + 郡: 4404, + 部: 1200, + 金: 2163, + 長: 421, + 開: -1432, + 間: 1302, + 関: -1282, + 雨: 2009, + 電: -1045, + 非: 2066, + 駅: 1620, + "1": -800, + "」": 2670, + "・": -3794, + ッ: -1350, + ア: 551, + グ: 1319, + ス: 874, + ト: 521, + ム: 1109, + ル: 1591, + ロ: 2201, + ン: 278, + }; + this.UW4__ = { + ",": 3930, + ".": 3508, + "―": -4841, + "、": 3930, + "。": 3508, + 〇: 4999, + "「": 1895, + "」": 3798, + "〓": -5156, + あ: 4752, + い: -3435, + う: -640, + え: -2514, + お: 2405, + か: 530, + が: 6006, + き: -4482, + ぎ: -3821, + く: -3788, + け: -4376, + げ: -4734, + こ: 2255, + ご: 1979, + さ: 2864, + し: -843, + じ: -2506, + す: -731, + ず: 1251, + せ: 181, + そ: 4091, + た: 5034, + だ: 5408, + ち: -3654, + っ: -5882, + つ: -1659, + て: 3994, + で: 7410, + と: 4547, + な: 5433, + に: 6499, + ぬ: 1853, + ね: 1413, + の: 7396, + は: 8578, + ば: 1940, + ひ: 4249, + び: -4134, + ふ: 1345, + へ: 6665, + べ: -744, + ほ: 1464, + ま: 1051, + み: -2082, + む: -882, + め: -5046, + も: 4169, + ゃ: -2666, + や: 2795, + ょ: -1544, + よ: 3351, + ら: -2922, + り: -9726, + る: -14896, + れ: -2613, + ろ: -4570, + わ: -1783, + を: 13150, + ん: -2352, + カ: 2145, + コ: 1789, + セ: 1287, + ッ: -724, + ト: -403, + メ: -1635, + ラ: -881, + リ: -541, + ル: -856, + ン: -3637, + "・": -4371, + ー: -11870, + 一: -2069, + 中: 2210, + 予: 782, + 事: -190, + 井: -1768, + 人: 1036, + 以: 544, + 会: 950, + 体: -1286, + 作: 530, + 側: 4292, + 先: 601, + 党: -2006, + 共: -1212, + 内: 584, + 円: 788, + 初: 1347, + 前: 1623, + 副: 3879, + 力: -302, + 動: -740, + 務: -2715, + 化: 776, + 区: 4517, + 協: 1013, + 参: 1555, + 合: -1834, + 和: -681, + 員: -910, + 器: -851, + 回: 1500, + 国: -619, + 園: -1200, + 地: 866, + 場: -1410, + 塁: -2094, + 士: -1413, + 多: 1067, + 大: 571, + 子: -4802, + 学: -1397, + 定: -1057, + 寺: -809, + 小: 1910, + 屋: -1328, + 山: -1500, + 島: -2056, + 川: -2667, + 市: 2771, + 年: 374, + 庁: -4556, + 後: 456, + 性: 553, + 感: 916, + 所: -1566, + 支: 856, + 改: 787, + 政: 2182, + 教: 704, + 文: 522, + 方: -856, + 日: 1798, + 時: 1829, + 最: 845, + 月: -9066, + 木: -485, + 来: -442, + 校: -360, + 業: -1043, + 氏: 5388, + 民: -2716, + 気: -910, + 沢: -939, + 済: -543, + 物: -735, + 率: 672, + 球: -1267, + 生: -1286, + 産: -1101, + 田: -2900, + 町: 1826, + 的: 2586, + 目: 922, + 省: -3485, + 県: 2997, + 空: -867, + 立: -2112, + 第: 788, + 米: 2937, + 系: 786, + 約: 2171, + 経: 1146, + 統: -1169, + 総: 940, + 線: -994, + 署: 749, + 者: 2145, + 能: -730, + 般: -852, + 行: -792, + 規: 792, + 警: -1184, + 議: -244, + 谷: -1000, + 賞: 730, + 車: -1481, + 軍: 1158, + 輪: -1433, + 込: -3370, + 近: 929, + 道: -1291, + 選: 2596, + 郎: -4866, + 都: 1192, + 野: -1100, + 銀: -2213, + 長: 357, + 間: -2344, + 院: -2297, + 際: -2604, + 電: -878, + 領: -1659, + 題: -792, + 館: -1984, + 首: 1749, + 高: 2120, + "「": 1895, + "」": 3798, + "・": -4371, + ッ: -724, + ー: -11870, + カ: 2145, + コ: 1789, + セ: 1287, + ト: -403, + メ: -1635, + ラ: -881, + リ: -541, + ル: -856, + ン: -3637, + }; + this.UW5__ = { + ",": 465, + ".": -299, + 1: -514, + E2: -32768, + "]": -2762, + "、": 465, + "。": -299, + "「": 363, + あ: 1655, + い: 331, + う: -503, + え: 1199, + お: 527, + か: 647, + が: -421, + き: 1624, + ぎ: 1971, + く: 312, + げ: -983, + さ: -1537, + し: -1371, + す: -852, + だ: -1186, + ち: 1093, + っ: 52, + つ: 921, + て: -18, + で: -850, + と: -127, + ど: 1682, + な: -787, + に: -1224, + の: -635, + は: -578, + べ: 1001, + み: 502, + め: 865, + ゃ: 3350, + ょ: 854, + り: -208, + る: 429, + れ: 504, + わ: 419, + を: -1264, + ん: 327, + イ: 241, + ル: 451, + ン: -343, + 中: -871, + 京: 722, + 会: -1153, + 党: -654, + 務: 3519, + 区: -901, + 告: 848, + 員: 2104, + 大: -1296, + 学: -548, + 定: 1785, + 嵐: -1304, + 市: -2991, + 席: 921, + 年: 1763, + 思: 872, + 所: -814, + 挙: 1618, + 新: -1682, + 日: 218, + 月: -4353, + 査: 932, + 格: 1356, + 機: -1508, + 氏: -1347, + 田: 240, + 町: -3912, + 的: -3149, + 相: 1319, + 省: -1052, + 県: -4003, + 研: -997, + 社: -278, + 空: -813, + 統: 1955, + 者: -2233, + 表: 663, + 語: -1073, + 議: 1219, + 選: -1018, + 郎: -368, + 長: 786, + 間: 1191, + 題: 2368, + 館: -689, + "1": -514, + E2: -32768, + "「": 363, + イ: 241, + ル: 451, + ン: -343, + }; + this.UW6__ = { + ",": 227, + ".": 808, + 1: -270, + E1: 306, + "、": 227, + "。": 808, + あ: -307, + う: 189, + か: 241, + が: -73, + く: -121, + こ: -200, + じ: 1782, + す: 383, + た: -428, + っ: 573, + て: -1014, + で: 101, + と: -105, + な: -253, + に: -149, + の: -417, + は: -236, + も: -206, + り: 187, + る: -135, + を: 195, + ル: -673, + ン: -496, + 一: -277, + 中: 201, + 件: -800, + 会: 624, + 前: 302, + 区: 1792, + 員: -1212, + 委: 798, + 学: -960, + 市: 887, + 広: -695, + 後: 535, + 業: -697, + 相: 753, + 社: -507, + 福: 974, + 空: -822, + 者: 1811, + 連: 463, + 郎: 1082, + "1": -270, + E1: 306, + ル: -673, + ン: -496, + }; + + return this; + } + TinySegmenter.prototype.ctype_ = function (str) { + for (var i in this.chartype_) { + if (str.match(this.chartype_[i][0])) { + return this.chartype_[i][1]; + } + } + return "O"; + }; + + TinySegmenter.prototype.ts_ = function (v) { + if (v) { + return v; + } + return 0; + }; + + TinySegmenter.prototype.segment = function (input) { + if (input == null || input == undefined || input == "") { + return []; + } + var result = []; + var seg = ["B3", "B2", "B1"]; + var ctype = ["O", "O", "O"]; + var o = input.split(""); + for (i = 0; i < o.length; ++i) { + seg.push(o[i]); + ctype.push(this.ctype_(o[i])); + } + seg.push("E1"); + seg.push("E2"); + seg.push("E3"); + ctype.push("O"); + ctype.push("O"); + ctype.push("O"); + var word = seg[3]; + var p1 = "U"; + var p2 = "U"; + var p3 = "U"; + for (var i = 4; i < seg.length - 3; ++i) { + var score = this.BIAS__; + var w1 = seg[i - 3]; + var w2 = seg[i - 2]; + var w3 = seg[i - 1]; + var w4 = seg[i]; + var w5 = seg[i + 1]; + var w6 = seg[i + 2]; + var c1 = ctype[i - 3]; + var c2 = ctype[i - 2]; + var c3 = ctype[i - 1]; + var c4 = ctype[i]; + var c5 = ctype[i + 1]; + var c6 = ctype[i + 2]; + score += this.ts_(this.UP1__[p1]); + score += this.ts_(this.UP2__[p2]); + score += this.ts_(this.UP3__[p3]); + score += this.ts_(this.BP1__[p1 + p2]); + score += this.ts_(this.BP2__[p2 + p3]); + score += this.ts_(this.UW1__[w1]); + score += this.ts_(this.UW2__[w2]); + score += this.ts_(this.UW3__[w3]); + score += this.ts_(this.UW4__[w4]); + score += this.ts_(this.UW5__[w5]); + score += this.ts_(this.UW6__[w6]); + score += this.ts_(this.BW1__[w2 + w3]); + score += this.ts_(this.BW2__[w3 + w4]); + score += this.ts_(this.BW3__[w4 + w5]); + score += this.ts_(this.TW1__[w1 + w2 + w3]); + score += this.ts_(this.TW2__[w2 + w3 + w4]); + score += this.ts_(this.TW3__[w3 + w4 + w5]); + score += this.ts_(this.TW4__[w4 + w5 + w6]); + score += this.ts_(this.UC1__[c1]); + score += this.ts_(this.UC2__[c2]); + score += this.ts_(this.UC3__[c3]); + score += this.ts_(this.UC4__[c4]); + score += this.ts_(this.UC5__[c5]); + score += this.ts_(this.UC6__[c6]); + score += this.ts_(this.BC1__[c2 + c3]); + score += this.ts_(this.BC2__[c3 + c4]); + score += this.ts_(this.BC3__[c4 + c5]); + score += this.ts_(this.TC1__[c1 + c2 + c3]); + score += this.ts_(this.TC2__[c2 + c3 + c4]); + score += this.ts_(this.TC3__[c3 + c4 + c5]); + score += this.ts_(this.TC4__[c4 + c5 + c6]); + // score += this.ts_(this.TC5__[c4 + c5 + c6]); + score += this.ts_(this.UQ1__[p1 + c1]); + score += this.ts_(this.UQ2__[p2 + c2]); + score += this.ts_(this.UQ3__[p3 + c3]); + score += this.ts_(this.BQ1__[p2 + c2 + c3]); + score += this.ts_(this.BQ2__[p2 + c3 + c4]); + score += this.ts_(this.BQ3__[p3 + c2 + c3]); + score += this.ts_(this.BQ4__[p3 + c3 + c4]); + score += this.ts_(this.TQ1__[p2 + c1 + c2 + c3]); + score += this.ts_(this.TQ2__[p2 + c2 + c3 + c4]); + score += this.ts_(this.TQ3__[p3 + c1 + c2 + c3]); + score += this.ts_(this.TQ4__[p3 + c2 + c3 + c4]); + var p = "O"; + if (score > 0) { + result.push(word); + word = ""; + p = "B"; + } + p1 = p2; + p2 = p3; + p3 = p; + word += seg[i]; + } + result.push(word); + + return result; + }; + + lunr.TinySegmenter = TinySegmenter; + }; +}); |