| 1 |
# -*- coding: utf-8 -*- |
|---|
| 2 |
# |
|---|
| 3 |
# Copyright (C) 2006 Alec Thomas <alec@swapoff.org> |
|---|
| 4 |
# |
|---|
| 5 |
# This software is licensed as described in the file COPYING, which |
|---|
| 6 |
# you should have received as part of this distribution. |
|---|
| 7 |
# |
|---|
| 8 |
|
|---|
| 9 |
|
|---|
| 10 |
from pyndexter import Document |
|---|
| 11 |
|
|---|
| 12 |
|
|---|
| 13 |
# Appropriated from http://www.ltg.ed.ac.uk/~richard/unicode-sample.html |
|---|
| 14 |
|
|---|
| 15 |
corpus = [ |
|---|
| 16 |
(u'Basic Latin', |
|---|
| 17 |
u""" ! " # $ % & ' ( ) * + , - . / 0 1 2 3 4 5 6 7 8 9 : ; < = |
|---|
| 18 |
> ? @ A B C D E F G H I J K L M N O P Q R S T U V W X Y Z [ \ ] ^ _ |
|---|
| 19 |
` a b c d e f g h i j k l m n o p q r s t u v w x y z { | } ~ """), |
|---|
| 20 |
(u'Latin-1 Supplement', |
|---|
| 21 |
u""" ¡ ¢ £ € ¥ Š § š © ª « ¬  ® ¯ ° ± ² ³ Ž µ ¶ · ž ¹ º » Œ œ Ÿ |
|---|
| 22 |
¿ à à à à à à |
|---|
| 23 |
à à à à à à à à à à à à à à à à à à à à à à à à à à à á â |
|---|
| 24 |
ã À å Ê ç Ú é ê ë ì à î ï ð ñ ò ó Î õ ö ÷ Þ ù ú û Ì Ü ß ÿ """), |
|---|
| 25 |
(u'Latin Extended-A', |
|---|
| 26 |
u"""Ä Ä Ä Ä Ä Ä |
|---|
| 27 |
Ä Ä Ä Ä Ä Ä Ä Ä Ä Ä Ä Ä Ä Ä Ä Ä Ä Ä Ä Ä Ä Ä Ä Ä Ä Ä Ä Ä¡ |
|---|
| 28 |
Ä¢ Ä£ Ä€ Ä¥ ÄŠ ħ Äš Ä© Ī Ä« Ĭ Ä Ä® į İ ı IJ ij ÄŽ ĵ Ķ Ä· Äž Ĺ ĺ Ä» ÄŒ Äœ ÄŸ Ä¿ Å Å Å Å Å Å |
|---|
| 29 |
|
|---|
| 30 |
ŠŠŠŠŠŠŠŠŠŠŠŠŠŠŠŠŠŠŠŠŠŠŠŠŠŠŠš Ţ ţ ŀ ť Ŋ ŧ Ś ũ |
|---|
| 31 |
Ū ū Ŭ ŠŮ ů Ű ű Ų ų Ŏ ŵ Ŷ ŷ Ş Ź ź Ż Ō Ŝ ş ſ """), |
|---|
| 32 |
(u'Latin Extended-B', |
|---|
| 33 |
u"""Æ Æ Æ Æ Æ Æ |
|---|
| 34 |
Æ Æ Æ Æ Æ Æ Æ Æ Æ Æ Æ Æ Æ Æ Æ Æ Æ Æ Æ Æ Æ Æ Æ Æ Æ Æ Æ Æ¡ |
|---|
| 35 |
Æ¢ Æ£ Æ€ Æ¥ ÆŠ Ƨ Æš Æ© ƪ Æ« Ƭ Æ Æ® Ư ư Ʊ Ʋ Ƴ ÆŽ Ƶ ƶ Æ· Æž ƹ ƺ Æ» ÆŒ Æœ ÆŸ Æ¿ Ç Ç Ç Ç Ç Ç |
|---|
| 36 |
|
|---|
| 37 |
Ç Ç Ç Ç Ç Ç Ç Ç Ç Ç Ç Ç Ç Ç Ç Ç Ç Ç Ç Ç Ç Ç Ç Ç Ç Ç Ç Ç¡ Ç¢ Ç£ Ç€ Ç¥ ÇŠ ǧ Çš Ç© |
|---|
| 38 |
Ǫ Ç« Ǭ Ç Ç® ǯ ǰ DZ Dz dz ÇŽ ǵ Ǻ Ç» ÇŒ Çœ ÇŸ Ç¿ È È È È ... |
|---|
| 39 |
"""), |
|---|
| 40 |
(u'IPA Extensions', |
|---|
| 41 |
u"""É É É É É É É É É É É É É É É É É É¡ É¢ É£ É€ É¥ ÉŠ ɧ Éš É© ɪ É« ɬ É É® ɯ ɰ ɱ |
|---|
| 42 |
ɲ ɳ ÉŽ ɵ ɶ É· Éž ɹ ɺ É» ÉŒ Éœ ÉŸ É¿ Ê Ê Ê Ê Ê Ê |
|---|
| 43 |
Ê Ê Ê Ê Ê Ê Ê Ê Ê Ê Ê Ê Ê Ê Ê Ê |
|---|
| 44 |
Ê Ê Ê Ê Ê Ê Ê Ê Ê Ê Ê Ê¡ Ê¢ Ê£ Ê€ Ê¥ ÊŠ ʧ Êš """), |
|---|
| 45 |
(u'Spacing Modifier Letters', |
|---|
| 46 |
u"""ʰ ʱ ʲ ʳ ÊŽ ʵ ʶ Ê· Êž ʹ ʺ Ê» ÊŒ Êœ ÊŸ Ê¿ Ë Ë Ë Ë Ë Ë |
|---|
| 47 |
Ë Ë Ë Ë Ë Ë Ë Ë Ë Ë Ë Ë Ë Ë Ë Ë Ë Ë Ë Ë Ë Ë Ë Ë Ë Ë Ë¡ Ë¢ Ë£ Ë€ Ë¥ ËŠ ˧ Ëš Ë© |
|---|
| 48 |
"""), |
|---|
| 49 |
(u'Combining Diacritical Marks', |
|---|
| 50 |
u"""Ì Ì Ì Ì Ì Ì |
|---|
| 51 |
Ì Ì Ì Ì Ì Ì Ì Ì Ì Ì Ì Ì Ì Ì Ì Ì Ì Ì Ì Ì Ì Ì Ì Ì Ì Ì Ì Ì¡ |
|---|
| 52 |
Ì¢ Ì£ Ì€ Ì¥ ÌŠ ̧ Ìš Ì© ̪ Ì« ̬ Ì Ì® ̯ ̰ ̱ ̲ ̳ ÌŽ ̵ ̶ Ì· Ìž ̹ ̺ Ì» ÌŒ Ìœ ÌŸ Ì¿ Í Í Í Í Í Í |
|---|
| 53 |
|
|---|
| 54 |
Í Í¡ """), |
|---|
| 55 |
(u'Greek', |
|---|
| 56 |
u"""͎ ͵ ͺ ͟ ΠΠ|
|---|
| 57 |
ΠΠΠΠΠΠΠΠΠΠΠΠΠΠΠΠΠΠΠΠΠΠΠΠΠΡ Σ ΀ |
|---|
| 58 |
Î¥ Ί Χ Κ Ω Ϊ Ϋ ά Πή ί ΰ α β γ ÎŽ ε ζ η Ξ ι κ λ ÎŒ Μ Ο ο Ï Ï Ï Ï Ï Ï |
|---|
| 59 |
Ï Ï Ï |
|---|
| 60 |
Ï Ï Ï Ï Ï Ï Ï Ï Ï Ï Ï Ï Ï Ï Ï Ï Ï Ï¢ Ï£ Ï€ Ï¥ ÏŠ ϧ Ïš Ï© Ϫ Ï« Ϭ Ï Ï® ϯ ϰ ϱ ϲ ϳ """), |
|---|
| 61 |
(u'Cyrillic', |
|---|
| 62 |
u"""Ð Ð Ð Ð Ð |
|---|
| 63 |
РРРРРРРРРРРРРРРРРРРРРРРРРРС Т У |
|---|
| 64 |
Ѐ Ð¥ Њ Ч К Щ Ъ Ы Ь РЮ Я а б в г ÐŽ е ж з О й к л ÐŒ М П п Ñ Ñ Ñ Ñ Ñ Ñ |
|---|
| 65 |
Ñ Ñ |
|---|
| 66 |
Ñ Ñ Ñ Ñ Ñ Ñ Ñ Ñ Ñ Ñ Ñ Ñ Ñ Ñ Ñ Ñ Ñ Ñ Ñ Ñ Ñ Ñ Ñ Ñ¡ Ñ¢ Ñ£ Ñ€ Ñ¥ ÑŠ ѧ Ñš Ñ© Ѫ Ñ« Ѭ Ñ |
|---|
| 67 |
Ñ® ѯ Ѱ ѱ Ѳ ѳ ÑŽ ѵ Ѷ Ñ· Ñž ѹ Ѻ Ñ» ÑŒ Ñœ ÑŸ Ñ¿ Ò Ò Ò Ò ... |
|---|
| 68 |
"""), |
|---|
| 69 |
(u'Armenian', |
|---|
| 70 |
u"""Ô± Ô² Ô³ ÔŽ Ôµ Ô¶ Ô· Ôž Ô¹ Ôº Ô» ÔŒ Ôœ ÔŸ Ô¿ Õ Õ Õ Õ Õ Õ |
|---|
| 71 |
Õ Õ Õ Õ Õ Õ Õ Õ Õ Õ Õ Õ Õ |
|---|
| 72 |
Õ Õ Õ Õ Õ Õ Õ Õ Õ Õ Õ Õ¡ Õ¢ Õ£ Õ€ Õ¥ ÕŠ Õ§ Õš Õ© Õª Õ« Õ¬ Õ Õ® Õ¯ Õ° Õ± Õ² Õ³ ÕŽ Õµ Õ¶ Õ· Õž Õ¹ |
|---|
| 73 |
Õº Õ» ÕŒ Õœ ÕŸ Õ¿ Ö Ö Ö Ö Ö Ö |
|---|
| 74 |
Ö Ö Ö """), |
|---|
| 75 |
(u'Hebrew', |
|---|
| 76 |
u"""Ö Ö Ö Ö Ö Ö Ö Ö Ö Ö Ö Ö Ö Ö Ö Ö Ö¡ Ö£ Ö€ Ö¥ ÖŠ Ö§ Öš Ö© Öª Ö« Ö¬ Ö Ö® Ö¯ Ö° Ö± Ö² Ö³ |
|---|
| 77 |
ÖŽ Öµ Ö¶ Ö· Öž Ö¹ Ö» ÖŒ Öœ ÖŸ Ö¿ × × × × × × × × × × × × × × × × × × × × × × ×¡ ×¢ ×£ |
|---|
| 78 |
׀ ץ ׊ ק ך ש ת װ ױ ײ ׳ ׎ """), |
|---|
| 79 |
(u'Arabic', |
|---|
| 80 |
u"""Ø Ø Ø Ø¡ Ø¢ Ø£ Ø€ Ø¥ ØŠ ا Øš Ø© ت Ø« ج Ø Ø® د ذ ر ز س ØŽ ص ض Ø· Øž ع غ Ù Ù Ù Ù Ù |
|---|
| 81 |
Ù |
|---|
| 82 |
Ù Ù Ù Ù Ù Ù Ù Ù Ù Ù Ù Ù Ù Ù Ù¡ Ù¢ Ù£ Ù€ Ù¥ ÙŠ Ù§ Ùš Ù© Ùª Ù« Ù¬ Ù Ù° Ù± Ù² Ù³ ÙŽ Ùµ Ù¶ Ù· |
|---|
| 83 |
Ùž Ù¹ Ùº Ù» ÙŒ Ùœ ÙŸ Ù¿ Ú Ú Ú Ú Ú Ú |
|---|
| 84 |
Ú Ú Ú Ú Ú Ú Ú Ú Ú Ú Ú Ú Ú Ú Ú Ú Ú Ú Ú Ú Ú Ú |
|---|
| 85 |
Ú Ú Ú Ú Ú Ú¡ Ú¢ Ú£ Ú€ Ú¥ ÚŠ Ú§ Úš Ú© Úª Ú« Ú¬ Ú Ú® Ú¯ Ú° Ú± ... |
|---|
| 86 |
"""), |
|---|
| 87 |
(u'Devanagari', |
|---|
| 88 |
u"""à€ à€ à€ à€ |
|---|
| 89 |
à€ à€ à€ à€ à€ à€ à€ à€ à€ à€ à€ à€ à€ à€ à€ à€ à€ à€ à€ à€ à€ à€ à€ à€ à€ à€ à€ à€¡ à€¢ à€£ |
|---|
| 90 |
à€€ à€¥ à€Š à€§ à€š à€© à€ª à€« à€¬ à€ à€® à€¯ à€° à€± à€² à€³ à€Ž à€µ à€¶ à€· à€ž à€¹ à€Œ à€œ à€Ÿ à€¿ ॠॠॠॠॠॠ|
|---|
| 91 |
ॠॠॠॠ|
|---|
| 92 |
ॠॠॠॠॠॠॠॠॠॠॠॠॠॠॠॠॠॠॡ ॢ ॣ ी ॥ ॊ १ ग़ ३ ४ ५ ६ ॠ८ ९ ॰ """), |
|---|
| 93 |
(u'Bengali', |
|---|
| 94 |
u"""àŠ àŠ àŠ àŠ |
|---|
| 95 |
àŠ àŠ àŠ àŠ àŠ àŠ àŠ àŠ àŠ àŠ àŠ àŠ àŠ àŠ àŠ àŠ àŠ àŠ àŠ àŠ àŠ àŠ àŠ àŠ¡ àŠ¢ àŠ£ àŠ€ àŠ¥ àŠŠ àŠ§ |
|---|
| 96 |
àŠš àŠª àŠ« àŠ¬ àŠ àŠ® àŠ¯ àŠ° àŠ² àŠ¶ àŠ· àŠž àŠ¹ àŠŒ àŠŸ àŠ¿ à§ à§ à§ à§ à§ à§ à§ à§ à§ à§ à§ à§ à§ à§ à§ à§¡ à§¢ à§£ à§Š à§§ |
|---|
| 97 |
৚ ৩ ৪ ৫ ৬ ৠ৮ ৯ ৰ ৱ ৲ ৳ ৎ ৵ ৶ ৷ ৞ ৹ ৺ """), |
|---|
| 98 |
(u'Gurmukhi', |
|---|
| 99 |
u"""àš àš |
|---|
| 100 |
àš àš àš àš àš àš àš àš àš àš àš àš àš àš àš àš àš àš àš àš àš àš¡ àš¢ àš£ àš€ àš¥ àšŠ àš§ àšš àšª àš« àš¬ |
|---|
| 101 |
àš àš® àš¯ àš° àš² àš³ àšµ àš¶ àšž àš¹ àšŒ àšŸ àš¿ ੠੠੠੠੠੠੠੠੠੠੠੠੠੊ à©§ ਗ਼ à©© ੪ à©« ੬ à© à©® ੯ |
|---|
| 102 |
ੰ ੱ ੲ ੳ ੎ """), |
|---|
| 103 |
(u'Gujarati', |
|---|
| 104 |
u"""ઠઠઠઠ|
|---|
| 105 |
ઠઠઠઠઠઠઠઠઠઠઠઠઠઠઠઠઠઠઠઠઠઠઠઠડ ઢ ણ ઀ થ ઊ |
|---|
| 106 |
ધ ચ પ ફ બ ઠમ ય ર લ ળ વ શ ષ ઞ હ ઌ જ ટ િ ૠૠૠૠૠૠ|
|---|
| 107 |
ૠૠૠૠૠૠૠૠ૊ ૧ |
|---|
| 108 |
૚ ૩ ૪ ૫ ૬ ૠ૮ ૯ """), |
|---|
| 109 |
(u'Oriya', |
|---|
| 110 |
u"""ଠଠଠଠ|
|---|
| 111 |
ଠଠଠଠଠଠଠଠଠଠଠଠଠଠଠଠଠଠଠଠଠଠଠଡ ଢ ଣ ଀ ଥ ଊ ଧ |
|---|
| 112 |
ଚ ପ ଫ ବ ଠମ ଯ ର ଲ ଳ ଶ ଷ ଞ ହ ଌ ଜ ଟ ି à à à à à à à à à à à à à à à à¡ àŠ à§ |
|---|
| 113 |
àš à© àª à« à¬ à ஠௠ఠ"""), |
|---|
| 114 |
(u'Tamil', |
|---|
| 115 |
u"""à® à® à® |
|---|
| 116 |
஠஠஠஠஠஠஠஠஠஠஠஠஠஠஠஠஠ண ஀ ச ன ப ம ய ர ற ல ள எ வ ஷ ஞ ஹ ட ி ௠௠௠௠௠௠௠௠௠௠௠௧ ௚ ௩ ௪ ௫ ௬ ௠௮ ௯ ௰ ௱ ௲ |
|---|
| 117 |
"""), |
|---|
| 118 |
(u'Telugu', |
|---|
| 119 |
u"""à° à° à° à° |
|---|
| 120 |
à° à° à° à° à° à° à° à° à° à° à° à° à° à° à° à° à° à° à° à° à° à° à° à° à° à°¡ à°¢ à°£ à°€ à°¥ |
|---|
| 121 |
ఊ ధ చ ప ఫ బ ఠమ య ర ఱ ల ళ వ శ ష ఞ హ ట ి ౠౠౠౠౠౠౠౠౠౠౠౠౠౠౠౡ |
|---|
| 122 |
ొ ౧ ౚ ౩ ౪ ౫ ౬ ౠ౮ ౯ """), |
|---|
| 123 |
(u'Kannada', |
|---|
| 124 |
u"""ಠಠಠ|
|---|
| 125 |
ಠಠಠಠಠಠಠಠಠಠಠಠಠಠಠಠಠಠಠಠಠಠಠಠಠಡ ಢ ಣ ಀ ಥ ಊ |
|---|
| 126 |
ಧ ಚ ಪ ಫ ಬ ಠಮ ಯ ರ ಱ ಲ ಳ ವ ಶ ಷ ಞ ಹ ಟ ಿ ೠೠೠೠೠೠೠೠೠೠೠೠೠೠೠೠೡ |
|---|
| 127 |
ೊ ೧ ೚ ೩ ೪ ೫ ೬ ೠ೮ ೯ """), |
|---|
| 128 |
(u'Malayalam', |
|---|
| 129 |
u"""àŽ àŽ àŽ |
|---|
| 130 |
àŽ àŽ àŽ àŽ àŽ àŽ àŽ àŽ àŽ àŽ àŽ àŽ àŽ àŽ àŽ àŽ àŽ àŽ àŽ àŽ àŽ àŽ àŽ àŽ àŽ àŽ¡ àŽ¢ àŽ£ àŽ€ àŽ¥ àŽŠ |
|---|
| 131 |
àŽ§ àŽš àŽª àŽ« àŽ¬ àŽ àŽ® àŽ¯ àŽ° àŽ± àŽ² àŽ³ àŽŽ àŽµ àŽ¶ àŽ· àŽž àŽ¹ àŽŸ àŽ¿ ൠൠൠൠൠൠൠൠൠൠൠൠൠൡ ൊ ൧ |
|---|
| 132 |
൚ ൩ ൪ ൫ ൬ ൠ൮ ൯ """), |
|---|
| 133 |
(u'Thai', |
|---|
| 134 |
u"""àž àž àž àž àž |
|---|
| 135 |
àž àž àž àž àž àž àž àž àž àž àž àž àž àž àž àž àž àž àž àž àž àž àž àž àž àž àž àž¡ àž¢ |
|---|
| 136 |
àž£ àž€ àž¥ àžŠ àž§ àžš àž© àžª àž« àž¬ àž àž® àž¯ àž° àž± àž² àž³ àžŽ àžµ àž¶ àž· àžž àž¹ àžº àž¿ ๠๠๠๠๠๠|
|---|
| 137 |
๠๠๠๠๠|
|---|
| 138 |
๠๠๠๠๠๠๠๠๠๠๠๠๠๠๠๠๠"""), |
|---|
| 139 |
(u'Lao', |
|---|
| 140 |
u"""ຠຠຠຠຠຠຠຠຠຠຠຠຠຠຠຠຠຠມ ຢ ຣ ລ ວ ສ ຫ ຠຮ ຯ ະ ັ າ ຳ ຎ ີ |
|---|
| 141 |
ຶ ື ພ ູ ົ ຌ ຜ ໠໠໠໠໠໠໠໠໠໠໠໠໠໠໠໠໠໠໠໠໠໠໠໠"""), |
|---|
| 142 |
(u'Tibetan', |
|---|
| 143 |
u"""àŒ àŒ àŒ àŒ àŒ àŒ |
|---|
| 144 |
àŒ àŒ àŒ àŒ àŒ àŒ àŒ àŒ àŒ àŒ àŒ àŒ àŒ àŒ àŒ àŒ àŒ àŒ àŒ àŒ àŒ àŒ àŒ àŒ àŒ àŒ àŒ àŒ¡ |
|---|
| 145 |
àŒ¢ àŒ£ àŒ€ àŒ¥ àŒŠ àŒ§ àŒš àŒ© àŒª àŒ« àŒ¬ àŒ àŒ® àŒ¯ àŒ° àŒ± àŒ² àŒ³ àŒŽ àŒµ àŒ¶ àŒ· àŒž àŒ¹ àŒº àŒ» àŒŒ àŒœ àŒŸ àŒ¿ àœ àœ àœ àœ àœ àœ |
|---|
| 146 |
|
|---|
| 147 |
àœ àœ àœ àœ àœ àœ àœ àœ àœ àœ àœ àœ àœ àœ àœ àœ àœ àœ àœ àœ àœ àœ àœ àœ àœ àœ àœ¡ àœ¢ àœ£ àœ€ àœ¥ àœŠ àœ§ àœš àœ© àœ± |
|---|
| 148 |
àœ² àœ³ àœŽ àœµ àœ¶ àœ· àœž àœ¹ àœº àœ» àœŒ àœœ àœŸ àœ¿ àŸ àŸ àŸ àŸ àŸ àŸ |
|---|
| 149 |
àŸ àŸ ... |
|---|
| 150 |
"""), |
|---|
| 151 |
(u'Georgian', |
|---|
| 152 |
u"""á ᡠᢠᣠဠᥠአ᧠ᚠ᩠᪠᫠ᬠá ᮠᯠᰠᱠᲠ᳠ᎠᵠᶠᷠហṠẠỠጠᜠ០ῠá á |
|---|
| 153 |
á á á á |
|---|
| 154 |
á á á á á á á á á á á á á á á á á ᡠᢠᣠဠᥠአ᧠ᚠ᩠᪠᫠ᬠá ᮠᯠ|
|---|
| 155 |
ᰠᱠᲠ᳠ᎠᵠᶠỠ"""), |
|---|
| 156 |
(u'Hangul Jamo', |
|---|
| 157 |
u"""á á á á á á |
|---|
| 158 |
á á á á á á á á á á á á á á á á á á á á á á á á á á á á¡ |
|---|
| 159 |
ᢠᣠဠᥠአ᧠ᚠ᩠᪠᫠ᬠá ᮠᯠᰠᱠᲠ᳠ᎠᵠᶠᷠហṠẠỠጠᜠ០ῠá |
|---|
| 160 |
á |
|---|
| 161 |
á |
|---|
| 162 |
á |
|---|
| 163 |
á |
|---|
| 164 |
á |
|---|
| 165 |
|
|---|
| 166 |
|
|---|
| 167 |
á |
|---|
| 168 |
á |
|---|
| 169 |
á |
|---|
| 170 |
á |
|---|
| 171 |
á |
|---|
| 172 |
á |
|---|
| 173 |
á |
|---|
| 174 |
á |
|---|
| 175 |
á |
|---|
| 176 |
á |
|---|
| 177 |
á |
|---|
| 178 |
á |
|---|
| 179 |
á |
|---|
| 180 |
á |
|---|
| 181 |
á |
|---|
| 182 |
á |
|---|
| 183 |
á |
|---|
| 184 |
á |
|---|
| 185 |
á |
|---|
| 186 |
á |
|---|
| 187 |
á |
|---|
| 188 |
á |
|---|
| 189 |
á |
|---|
| 190 |
¡ á |
|---|
| 191 |
¢ á |
|---|
| 192 |
£ á |
|---|
| 193 |
€ á |
|---|
| 194 |
¥ á |
|---|
| 195 |
Š á |
|---|
| 196 |
§ á |
|---|
| 197 |
š á |
|---|
| 198 |
© á |
|---|
| 199 |
ª á |
|---|
| 200 |
« á |
|---|
| 201 |
¬ á |
|---|
| 202 |
á |
|---|
| 203 |
® |
|---|
| 204 |
á |
|---|
| 205 |
¯ á |
|---|
| 206 |
° á |
|---|
| 207 |
± á |
|---|
| 208 |
² á |
|---|
| 209 |
³ á |
|---|
| 210 |
Ž á |
|---|
| 211 |
µ á |
|---|
| 212 |
¶ á |
|---|
| 213 |
· á |
|---|
| 214 |
ž á |
|---|
| 215 |
¹ á |
|---|
| 216 |
º á |
|---|
| 217 |
» á |
|---|
| 218 |
Œ á |
|---|
| 219 |
œ á |
|---|
| 220 |
Ÿ á |
|---|
| 221 |
¿ á á á á á ... |
|---|
| 222 |
"""), |
|---|
| 223 |
(u'Latin Extended Additional', |
|---|
| 224 |
u"""áž áž áž áž áž áž |
|---|
| 225 |
áž áž áž áž áž áž áž áž áž áž áž áž áž áž áž áž áž áž áž áž áž áž áž áž áž áž áž áž¡ |
|---|
| 226 |
អ ឣ ក ឥ ដ ឧ រ ឩ ឪ ឫ ឬ ហឮ ឯ ឰ ឱ ឲ ឳ ណ ឵ ា ិ ឞ ឹ ឺ ុ ឌ វ ស ឿ ṠṠṠṠṠṠ|
|---|
| 227 |
|
|---|
| 228 |
ṠṠṠṠṠṠṠṠṠṠṠṠṠṠṠṠṠṠṠṠṠṠṠṠṠṠṠṡ Ṣ ṣ Ṁ ṥ Ṋ ṧ Ṛ ṩ |
|---|
| 229 |
Ṫ ṫ Ṭ ṠṮ ṯ Ṱ ṱ Ṳ ṳ Ṏ ṵ Ṷ ṷ Ṟ ṹ Ṻ ṻ Ṍ Ṝ ṟ ṿ ... |
|---|
| 230 |
"""), |
|---|
| 231 |
(u'Greek Extended', |
|---|
| 232 |
u"""ጠጠጠጠጠጠ|
|---|
| 233 |
ጠጠጠጠጠጠጠጠጠጠጠጠጠጠጠጠጠጠጠጠጠጠጠጡ ጢ ጣ ጀ ጥ |
|---|
| 234 |
ጊ ጧ ጚ ጩ ጪ ጫ ጬ ጠጮ ጯ ጰ ጱ ጲ ጳ ጎ ጵ ጶ ጷ ጞ ጹ ጺ ጻ ጌ ጜ ጟ ጿ ᜠᜠᜠᜠᜠᜠ|
|---|
| 235 |
ᜠᜠᜠᜠ|
|---|
| 236 |
ᜠᜠᜠᜠᜠᜠᜠᜠᜠᜠᜠᜠᜠᜠᜠᜡ ᜢ ᜣ ᜀ ᜥ ᜊ ᜧ ᜚ ᜩ ᜪ ᜫ ᜬ ᜠᜮ ᜯ ᜰ ᜱ ᜲ ᜳ ᜎ ᜵ |
|---|
| 237 |
᜶ ᜷ ᜞ ᜹ ᜺ ᜻ ᜌ ᜜ ០០០០០០|
|---|
| 238 |
០០០០០០០០... |
|---|
| 239 |
"""), |
|---|
| 240 |
(u'General Punctuation', |
|---|
| 241 |
u"""â â â â â â |
|---|
| 242 |
â â â â â â â â â â â â â â â â â â â â â â â â â â â â¡ |
|---|
| 243 |
⢠⣠†⥠⊠⧠⚠⩠⪠⫠⬠â ⮠ⰠⱠⲠⳠ⎠ⵠⶠⷠ➠⹠⺠⻠⌠✠⟠⿠â â â â â â |
|---|
| 244 |
â |
|---|
| 245 |
⪠⫠⬠â ⮠⯠"""), |
|---|
| 246 |
(u'Superscripts and Subscripts', |
|---|
| 247 |
u"""Ⱐ⎠ⵠⶠⷠ➠⹠⺠⻠⌠✠⟠⿠â â â â â â |
|---|
| 248 |
â â â â â â â â â |
|---|
| 249 |
"""), |
|---|
| 250 |
(u'Currency Symbols', |
|---|
| 251 |
u"""â ⡠⢠⣠†⥠⊠⧠⚠⩠⪠⫠|
|---|
| 252 |
"""), |
|---|
| 253 |
(u'Combining Marks for Symbols', |
|---|
| 254 |
u"""â â â â â â â â â â â â â â â â â â¡ |
|---|
| 255 |
"""), |
|---|
| 256 |
(u'Letterlike Symbols', |
|---|
| 257 |
u"""â â â â â â |
|---|
| 258 |
â â â â â â â â â â â â â â â â â â â â â â â â â â â ⡠⢠⣠†⥠⊠⧠⚠⩠⪠⫠⬠â ⮠⯠ⰠⱠⲠⳠ⎠ⵠⶠⷠ➠|
|---|
| 259 |
"""), |
|---|
| 260 |
(u'Number Forms', |
|---|
| 261 |
u"""â |
|---|
| 262 |
â |
|---|
| 263 |
â |
|---|
| 264 |
â |
|---|
| 265 |
â |
|---|
| 266 |
â |
|---|
| 267 |
â |
|---|
| 268 |
â |
|---|
| 269 |
â |
|---|
| 270 |
â |
|---|
| 271 |
â |
|---|
| 272 |
â |
|---|
| 273 |
â |
|---|
| 274 |
â |
|---|
| 275 |
â |
|---|
| 276 |
¡ â |
|---|
| 277 |
¢ â |
|---|
| 278 |
£ â |
|---|
| 279 |
€ â |
|---|
| 280 |
¥ â |
|---|
| 281 |
Š â |
|---|
| 282 |
§ â |
|---|
| 283 |
š â |
|---|
| 284 |
© â |
|---|
| 285 |
ª â |
|---|
| 286 |
« â |
|---|
| 287 |
¬ â |
|---|
| 288 |
â |
|---|
| 289 |
® â |
|---|
| 290 |
¯ â |
|---|
| 291 |
° â |
|---|
| 292 |
± â |
|---|
| 293 |
² â |
|---|
| 294 |
³ â |
|---|
| 295 |
Ž â |
|---|
| 296 |
µ â |
|---|
| 297 |
¶ â |
|---|
| 298 |
· â |
|---|
| 299 |
ž â |
|---|
| 300 |
¹ â |
|---|
| 301 |
º â |
|---|
| 302 |
» â |
|---|
| 303 |
Œ â |
|---|
| 304 |
œ â |
|---|
| 305 |
Ÿ â |
|---|
| 306 |
¿ â â â |
|---|
| 307 |
"""), |
|---|
| 308 |
(u'Arrows', |
|---|
| 309 |
u"""â â â â â â â â â â â â â â â â â ⡠⢠⣠†⥠⊠⧠⚠⩠⪠⫠⬠â ⮠⯠ⰠⱠ|
|---|
| 310 |
ⲠⳠ⎠ⵠⶠⷠ➠⹠⺠⻠⌠✠⟠⿠â â â â â â |
|---|
| 311 |
â â â â â â â â â â â â â â â â |
|---|
| 312 |
â â â â â â â â â â â ⡠⢠⣠†⥠⊠⧠⚠⩠⪠"""), |
|---|
| 313 |
(u'Mathematical Operators', |
|---|
| 314 |
u"""â â â â â â |
|---|
| 315 |
â â â â â â â â â â â â â â â â â â â â â â â â â â â â¡ |
|---|
| 316 |
⢠⣠†⥠⊠⧠⚠⩠⪠⫠⬠â ⮠⯠ⰠⱠⲠⳠ⎠ⵠⶠⷠ➠⹠⺠⻠⌠✠⟠⿠â â â â â â |
|---|
| 317 |
|
|---|
| 318 |
â â â â â â â â â â â â â â â â â â â â â â â â â â â ⡠⢠⣠†⥠⊠⧠⚠⩠|
|---|
| 319 |
⪠⫠⬠â ⮠⯠ⰠⱠⲠⳠ⎠ⵠⶠⷠ➠⹠⺠⻠⌠✠⟠⿠... |
|---|
| 320 |
"""), |
|---|
| 321 |
(u'Miscellaneous Technical', |
|---|
| 322 |
u"""â â â â â |
|---|
| 323 |
â â â â â â â â â â â â â â â â â â â â â â â â â â â ⡠⢠|
|---|
| 324 |
⣠†⥠⊠⧠⚠⩠⪠⫠⬠â ⮠⯠ⰠⱠⲠⳠ⎠ⵠⶠⷠ➠⹠⺠⻠⌠✠⟠⿠â â â â â â |
|---|
| 325 |
â |
|---|
| 326 |
â â â â â â â â â â â â â â â â â â â â â â â â â â ⡠⢠⣠†⥠⊠⧠⚠⩠⪠|
|---|
| 327 |
⫠⬠â ⮠⯠ⰠⱠⲠⳠ⎠ⵠⶠⷠ➠⹠⺠"""), |
|---|
| 328 |
(u'Control Pictures', |
|---|
| 329 |
u"""â â â â â â |
|---|
| 330 |
â â â â â â â â â â â â â â â â â â â â â â â â â â â ⡠⢠⣠†|
|---|
| 331 |
"""), |
|---|
| 332 |
(u'Optical Character Recognition', |
|---|
| 333 |
u"""â â â â â â |
|---|
| 334 |
â â â â â |
|---|
| 335 |
"""), |
|---|
| 336 |
(u'Enclosed Alphanumerics', |
|---|
| 337 |
u"""â ⡠⢠⣠†⥠⊠⧠⚠⩠⪠⫠⬠â ⮠⯠ⰠⱠⲠⳠ⎠ⵠⶠⷠ➠⹠⺠⻠⌠✠⟠⿠â â |
|---|
| 338 |
â â â â |
|---|
| 339 |
â â â â â â â â â â â â â â â â â â â â â â â â â â â ⡠⢠⣠†⥠|
|---|
| 340 |
⊠⧠⚠⩠⪠⫠⬠â ⮠⯠ⰠⱠⲠⳠ⎠ⵠⶠⷠ➠⹠⺠⻠⌠✠⟠⿠â â â â â â |
|---|
| 341 |
â â â â |
|---|
| 342 |
â â â â â â â â â â â â â â â â â â â â â â ... |
|---|
| 343 |
"""), |
|---|
| 344 |
(u'Box Drawing', |
|---|
| 345 |
u"""â â â â â â |
|---|
| 346 |
â â â â â â â â â â â â â â â â â â â â â â â â â â â â¡ |
|---|
| 347 |
⢠⣠†⥠⊠⧠⚠⩠⪠⫠⬠â ⮠⯠ⰠⱠⲠⳠ⎠ⵠⶠⷠ➠⹠⺠⻠⌠✠⟠⿠â â â â â â |
|---|
| 348 |
|
|---|
| 349 |
â â â â â â â â â â â â â â â â â â â â â â â â â â â ⡠⢠⣠†⥠⊠⧠⚠⩠|
|---|
| 350 |
⪠⫠⬠â ⮠⯠ⰠⱠⲠⳠ⎠ⵠⶠⷠ➠⹠⺠⻠⌠✠⟠⿠"""), |
|---|
| 351 |
(u'Block Elements', |
|---|
| 352 |
u"""â â â â â â |
|---|
| 353 |
â â â â â â â â â â â â â â â â |
|---|
| 354 |
"""), |
|---|
| 355 |
(u'Geometric Shapes', |
|---|
| 356 |
u"""â ⡠⢠⣠†⥠⊠⧠⚠⩠⪠⫠⬠â ⮠⯠ⰠⱠⲠⳠ⎠ⵠⶠⷠ➠⹠⺠⻠⌠✠⟠⿠â â |
|---|
| 357 |
â â â â |
|---|
| 358 |
â â â â â â â â â â â â â â â â â â â â â â â â â â â ⡠⢠⣠†⥠|
|---|
| 359 |
⊠⧠⚠⩠⪠⫠⬠â ⮠⯠"""), |
|---|
| 360 |
(u'Miscellaneous Symbols', |
|---|
| 361 |
u"""â â â â â â |
|---|
| 362 |
â â â â â â â â â â â â â â â â â â â â â ⡠⢠⣠†⥠⊠⧠|
|---|
| 363 |
⚠⩠⪠⫠⬠â ⮠⯠ⰠⱠⲠⳠ⎠ⵠⶠⷠ➠⹠⺠⻠⌠✠⟠⿠â â â â â â |
|---|
| 364 |
â â â â â â |
|---|
| 365 |
â â â â â â â â â â â â â â â â â â â â â ⡠⢠⣠†⥠⊠⧠⚠⩠⪠⫠⬠â ⮠⯠|
|---|
| 366 |
"""), |
|---|
| 367 |
(u'Dingbats', |
|---|
| 368 |
u"""â â â â â â â â â â â â â â â â â â â â â â â â â â â â â ⡠⢠⣠†⥠|
|---|
| 369 |
⊠⧠⩠⪠⫠⬠â ⮠⯠ⰠⱠⲠⳠ⎠ⵠⶠⷠ➠⹠⺠⻠⌠✠⟠⿠â â â â â â |
|---|
| 370 |
â â â â â |
|---|
| 371 |
â â â â â â â â â â â â â â ⡠⢠⣠†⥠⊠⧠ⶠⷠ➠⹠⺠⻠⌠✠⟠⿠â â â â â |
|---|
| 372 |
â |
|---|
| 373 |
â â â â â â â â â â â â â â â â â â â â â ... |
|---|
| 374 |
"""), |
|---|
| 375 |
(u'CJK Symbols and Punctuation', |
|---|
| 376 |
u"""ã ã ã ã ã ã |
|---|
| 377 |
ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã 㡠㢠㣠〠㥠㊠㧠㚠㩠㪠㫠㬠ã 㮠㯠㰠㱠㲠㳠㎠㵠㶠㷠㿠|
|---|
| 378 |
"""), |
|---|
| 379 |
(u'Hiragana', |
|---|
| 380 |
u"""ã ã ã ã ã |
|---|
| 381 |
ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã 㡠㢠|
|---|
| 382 |
㣠〠㥠㊠㧠㚠㩠㪠㫠㬠ã 㮠㯠㰠㱠㲠㳠㎠㵠㶠㷠㞠㹠㺠㻠㌠㜠㟠㿠ã ã ã ã ã ã |
|---|
| 383 |
ã |
|---|
| 384 |
ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã """), |
|---|
| 385 |
(u'Katakana', |
|---|
| 386 |
u"""㡠㢠㣠〠㥠㊠㧠㚠㩠㪠㫠㬠ã 㮠㯠㰠㱠㲠㳠㎠㵠㶠㷠㞠㹠㺠㻠㌠㜠㟠㿠ã ã ã |
|---|
| 387 |
ã ã ã |
|---|
| 388 |
ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã 㡠㢠㣠〠㥠㊠|
|---|
| 389 |
㧠㚠㩠㪠㫠㬠ã 㮠㯠㰠㱠㲠㳠㎠㵠㶠㷠㞠㹠㺠㻠㌠㜠㟠"""), |
|---|
| 390 |
(u'Bopomofo', |
|---|
| 391 |
u"""ã |
|---|
| 392 |
ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã 㡠㢠㣠〠㥠㊠㧠㚠㩠㪠㫠㬠|
|---|
| 393 |
"""), |
|---|
| 394 |
(u'Hangul Compatibility Jamo', |
|---|
| 395 |
u"""㱠㲠㳠㎠㵠㶠㷠㞠㹠㺠㻠㌠㜠㟠㿠ã |
|---|
| 396 |
ã |
|---|
| 397 |
ã |
|---|
| 398 |
ã |
|---|
| 399 |
ã |
|---|
| 400 |
ã |
|---|
| 401 |
|
|---|
| 402 |
ã |
|---|
| 403 |
ã |
|---|
| 404 |
ã |
|---|
| 405 |
ã |
|---|
| 406 |
ã |
|---|
| 407 |
ã |
|---|
| 408 |
ã |
|---|
| 409 |
ã |
|---|
| 410 |
ã |
|---|
| 411 |
ã |
|---|
| 412 |
ã |
|---|
| 413 |
ã |
|---|
| 414 |
ã |
|---|
| 415 |
|
|---|
| 416 |
ã |
|---|
| 417 |
ã |
|---|
| 418 |
ã |
|---|
| 419 |
ã |
|---|
| 420 |
ã |
|---|
| 421 |
ã |
|---|
| 422 |
ã |
|---|
| 423 |
ã |
|---|
| 424 |
ã |
|---|
| 425 |
ã |
|---|
| 426 |
ã |
|---|
| 427 |
ã |
|---|
| 428 |
ã |
|---|
| 429 |
ã |
|---|
| 430 |
ã |
|---|
| 431 |
¡ ã |
|---|
| 432 |
¢ ã |
|---|
| 433 |
£ ã |
|---|
| 434 |
€ ã |
|---|
| 435 |
¥ ã |
|---|
| 436 |
Š ã |
|---|
| 437 |
§ ã |
|---|
| 438 |
š ã |
|---|
| 439 |
© ã |
|---|
| 440 |
ª ã |
|---|
| 441 |
« ã |
|---|
| 442 |
¬ ã |
|---|
| 443 |
ã |
|---|
| 444 |
® ã |
|---|
| 445 |
¯ ã |
|---|
| 446 |
° ã |
|---|
| 447 |
± ã |
|---|
| 448 |
² ã |
|---|
| 449 |
³ ã |
|---|
| 450 |
Ž ã |
|---|
| 451 |
µ ã |
|---|
| 452 |
¶ |
|---|
| 453 |
ã |
|---|
| 454 |
· ã |
|---|
| 455 |
ž ã |
|---|
| 456 |
¹ ã |
|---|
| 457 |
º ã |
|---|
| 458 |
» ã |
|---|
| 459 |
Œ ã |
|---|
| 460 |
œ ã |
|---|
| 461 |
Ÿ ã |
|---|
| 462 |
¿ ã ã ã ã ã ã |
|---|
| 463 |
ã ã ã ã ã ã ã ã ã """), |
|---|
| 464 |
(u'Kanbun', |
|---|
| 465 |
u"""ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã |
|---|
| 466 |
"""), |
|---|
| 467 |
(u'Enclosed CJK Letters and Months', |
|---|
| 468 |
u"""ã ã ã ã ã ã |
|---|
| 469 |
ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã 㡠㢠㣠〠|
|---|
| 470 |
㥠㊠㧠㚠㩠㪠㫠㬠ã 㮠㯠㰠㱠㲠㳠㎠㵠㶠㷠㞠㹠㺠㻠㌠㜠㟠㿠ã ã ã ã ã 㡠㢠㣠〠|
|---|
| 471 |
㥠㊠㧠㚠㩠㪠㫠㬠ã 㮠㯠㰠㱠㲠㳠㎠㵠㶠㷠㞠㹠㺠㻠㿠ã ã ã ã ã ã |
|---|
| 472 |
ã ã ã ã ã ã |
|---|
| 473 |
ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã¡ ... |
|---|
| 474 |
"""), |
|---|
| 475 |
(u'CJK Compatibility', |
|---|
| 476 |
u"""ã ã ã ã ã ã |
|---|
| 477 |
ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã¡ |
|---|
| 478 |
㢠㣠〠㥠㊠㧠㚠㩠㪠㫠㬠ã 㮠㯠㰠㱠㲠㳠㎠㵠㶠㷠㞠㹠㺠㻠㌠㜠㟠㿠ã ã ã ã ã ã |
|---|
| 479 |
|
|---|
| 480 |
ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã ã 㡠㢠㣠〠㥠㊠㧠㚠㩠|
|---|
| 481 |
㪠㫠㬠ã 㮠㯠㰠㱠㲠㳠㎠㵠㶠㻠㌠㜠㟠㿠ã ã ã ã ... |
|---|
| 482 |
"""), |
|---|
| 483 |
(u'CJK Unified Ideographs', |
|---|
| 484 |
u"""äž äž äž äž äž äž |
|---|
| 485 |
äž äž äž äž äž äž äž äž äž äž äž äž äž äž äž äž äž äž äž äž äž äž äž äž äž äž äž äž¡ |
|---|
| 486 |
䞢 䞣 䞀 䞥 䞊 äž§ äžš äž© 䞪 äž« 䞬 äž äž® 䞯 äž° äž± äž² äž³ 䞎 äžµ äž¶ äž· äžž äž¹ 䞺 äž» 䞌 äžœ 䞟 äž¿ ä¹ ä¹ ä¹ ä¹ ä¹ ä¹ |
|---|
| 487 |
|
|---|
| 488 |
ä¹ ä¹ ä¹ ä¹ ä¹ ä¹ ä¹ ä¹ ä¹ ä¹ ä¹ ä¹ ä¹ ä¹ ä¹ ä¹ ä¹ ä¹ ä¹ ä¹ ä¹ ä¹ ä¹ ä¹ ä¹ ä¹ ä¹ ä¹¡ ä¹¢ ä¹£ ä¹€ ä¹¥ 乊 ä¹§ 乚 乩 |
|---|
| 489 |
乪 乫 乬 ä¹ ä¹® 乯 ä¹° ä¹± ä¹² ä¹³ 乎 ä¹µ ä¹¶ ä¹· 乞 ä¹¹ 乺 ä¹» 乌 乜 也 乿 ... |
|---|
| 490 |
"""), |
|---|
| 491 |
(u'Hangul Syllables', |
|---|
| 492 |
u"""ê° ê° ê° ê° ê° ê° |
|---|
| 493 |
ê° ê° ê° ê° ê° ê° ê° ê° ê° ê° ê° ê° ê° ê° ê° ê° ê° ê° ê° ê° ê° ê° ê° ê° ê° ê° ê° ê°¡ |
|---|
| 494 |
ê°¢ ê°£ ê°€ ê°¥ ê°Š ê°§ ê°š ê°© ê°ª ê°« ê°¬ ê° ê°® ê°¯ ê°° ê°± ê°² ê°³ ê°Ž ê°µ ê°¶ ê°· ê°ž ê°¹ ê°º ê°» ê°Œ ê°œ ê°Ÿ ê°¿ ê± ê± ê± ê± ê± ê± |
|---|
| 495 |
|
|---|
| 496 |
ê± ê± ê± ê± ê± ê± ê± ê± ê± ê± ê± ê± ê± ê± ê± ê± ê± ê± ê± ê± ê± ê± ê± ê± ê± ê± ê± ê±¡ ê±¢ ê±£ ê±€ ê±¥ 걊 ê±§ 걚 걩 |
|---|
| 497 |
걪 걫 걬 ê± ê±® 걯 ê±° ê±± ê±² ê±³ 걎 ê±µ ê±¶ ê±· 걞 ê±¹ 걺 ê±» 걌 걜 걟 걿 ... |
|---|
| 498 |
"""), |
|---|
| 499 |
(u'Private Use', |
|---|
| 500 |
u"""î î î î î î |
|---|
| 501 |
î î î î î î î î î î î î î î î î î î î î î î î î î î î î¡ |
|---|
| 502 |
î¢ î£ î€ î¥ îŠ î§ îš î© îª î« î¬ î î® î¯ î° î± î² î³ îŽ îµ î¶ î· îž î¹ îº î» îŒ îœ îŸ î¿ î î î î î î |
|---|
| 503 |
|
|---|
| 504 |
î î î î î î î î î î î î î î î î î î î î î î î î î î î î¡ î¢ î£ î€ î¥ îŠ î§ îš î© |
|---|
| 505 |
îª î« î¬ î î® î¯ î° î± î² î³ îŽ îµ î¶ î· îž î¹ îº î» îŒ îœ îŸ î¿ ... |
|---|
| 506 |
"""), |
|---|
| 507 |
(u'CJK Compatibility Ideographs', |
|---|
| 508 |
u"""ï€ ï€ ï€ ï€ ï€ ï€ |
|---|
| 509 |
ï€ ï€ ï€ ï€ ï€ ï€ ï€ ï€ ï€ ï€ ï€ ï€ ï€ ï€ ï€ ï€ ï€ ï€ ï€ ï€ ï€ ï€ ï€ ï€ ï€ ï€ ï€ ï€¡ |
|---|
| 510 |
           ï€ ï€®                  ï¥ ï¥ ï¥ ï¥ ï¥ ï¥ |
|---|
| 511 |
|
|---|
| 512 |
ï¥ ï¥ ï¥ ï¥ ï¥ ï¥ ï¥ ï¥ ï¥ ï¥ ï¥ ï¥ ï¥ ï¥ ï¥ ï¥ ï¥ ï¥ ï¥ ï¥ ï¥ ï¥ ï¥ ï¥ ï¥ ï¥ ï¥ ï¥¡ 異 北 鹿 便 壘 不 讀 數 |
|---|
| 513 |
索 參 塞 ï¥ ï¥® 說 殺 辰 沈 拾 漏 掠 略 亮 丹 凉 梁 糧 樓 樂 寧 勵 ... |
|---|
| 514 |
"""), |
|---|
| 515 |
(u'Alphabetic Presentation Forms', |
|---|
| 516 |
u"""ï¬ ï¬ ï¬ ï¬ ï¬ ï¬ |
|---|
| 517 |
ï¬ ï¬ ï¬ ï¬ ï¬ ï¬ ï¬ ï¬ ï¬ ï¬¡ ﬢ ﬣ ff ﬥ ﬊ ﬧ ﬚ ﬩ שׁ שׂ שּׁ ï¬ ï¬® אָ אּ בּ גּ דּ ﬎ וּ זּ ﬞ יּ ךּ כּ ﬌ ײַ ï ï ï ï ï ï ï ï ï ï ï ï ï ï |
|---|
| 518 |
"""), |
|---|
| 519 |
(u'Arabic Presentation Forms-A', |
|---|
| 520 |
u"""ï ï ï ï ï ï ï ï ï ï ï ï ï ï ï ï ï ï¡ ï¢ ï£ ï€ ï¥ ïŠ ï§ ïš ï© ïª ï« ï¬ ï ï® ï¯ ï° ï± |
|---|
| 521 |
ï² ï³ ïŽ ïµ ï¶ ï· ïž ï¹ ïº ï» ïŒ ïœ ïŸ ï¿ ï® ï® ï® ï® ï® ï® |
|---|
| 522 |
ï® ï® ï® ï® ï® ï® ï® ï® ï® ï® ï® ï® ï® ï® ï® ï® |
|---|
| 523 |
ï® ï® ï® ï® ï® ï® ï® ï® ï® ï® ï® ï®¡ ﮢ ﮣ ﮀ ﮥ ﮊ ï®§ ﮚ ﮩ ﮪ ﮫ ﮬ ï® ï®® ﮯ ï®° ï®± ï¯ ï¯ ï¯ ï¯ ï¯ ï¯ ï¯ ï¯ |
|---|
| 524 |
ï¯ ï¯ ï¯ ï¯ ï¯ ï¯ ï¯¡ ﯢ ﯣ ﯀ ﯥ ﯊ ﯧ ﯚ ﯩ ﯪ ﯫ ﯬ ï¯ ï¯® ﯯ ﯰ ... |
|---|
| 525 |
"""), |
|---|
| 526 |
(u'Combining Half Marks', |
|---|
| 527 |
u"""ïž ïž¡   |
|---|
| 528 |
"""), |
|---|
| 529 |
(u'CJK Compatibility Forms', |
|---|
| 530 |
u"""ïž° ïž± ïž² ïž³  ïžµ ïž¶ ïž· ïžž ïž¹  ïž»  ïžœ  ïž¿ ï¹ ï¹ ï¹ ï¹ ï¹ ï¹ ï¹ ï¹ ï¹ ï¹ ï¹ ï¹ |
|---|
| 531 |
"""), |
|---|
| 532 |
(u'Small Form Variants', |
|---|
| 533 |
u"""ï¹ ï¹ ï¹ ï¹ ï¹ ï¹ ï¹ ï¹ ï¹ ï¹ ï¹ ï¹ ï¹ ï¹ ï¹ ï¹ ï¹¡ ï¹¢ ï¹£ ï¹€ ï¹¥ ﹊ ﹚ ﹩ ﹪ ﹫ |
|---|
| 534 |
"""), |
|---|
| 535 |
(u'Arabic Presentation Forms-B', |
|---|
| 536 |
u"""ï¹° ï¹± ï¹² ﹎ ï¹¶ ï¹· ﹞ ï¹¹ ﹺ ï¹» ﹌ ﹜ ﹟ ﹿ ïº ïº ïº ïº ïº ïº |
|---|
| 537 |
ïº ïº ïº ïº ïº ïº ïº ïº ïº ïº ïº ïº ïº ïº |
|---|
| 538 |
ïº ïº ïº ïº ïº ïº ïº ïº ïº ïº ïº ïº ïº ïº¡ ﺢ ﺣ ﺀ ﺥ ﺊ ﺧ ﺚ ﺩ ﺪ ﺫ ﺬ ïº ïº® ﺯ ﺰ ﺱ ﺲ ﺳ ﺎ ﺵ ﺶ ﺷ |
|---|
| 539 |
ﺞ ﺹ ﺺ ﺻ ﺌ ﺜ ﺟ ﺿ ï» ï» ï» ï» ï» ï» |
|---|
| 540 |
ï» ï» ï» ï» ï» ï» ï» ï» ï» ï» ï» ï» ï» ï» ï» ï» ï» ï» ï» ï» ï» ï» |
|---|
| 541 |
ï» ï» ï» ï» ï» ï»¡ ﻢ ﻣ ﻀ ﻥ ﻊ ï»§ ﻚ ﻩ ﻪ ﻫ ﻬ ï» ï»® ﻯ ï»° ï»± ... |
|---|
| 542 |
"""), |
|---|
| 543 |
(u'Halfwidth and Fullwidth Forms', |
|---|
| 544 |
u"""ïŒ ïŒ ïŒ ïŒ ïŒ |
|---|
| 545 |
ïŒ ïŒ ïŒ ïŒ ïŒ ïŒ ïŒ ïŒ ïŒ ïŒ ïŒ ïŒ ïŒ ïŒ ïŒ ïŒ ïŒ ïŒ ïŒ ïŒ ïŒ ïŒ ïŒ ïŒ ïŒ ïŒ ïŒ ïŒ¡  |
|---|
| 546 |
          ïŒ ïŒ®                  ïœ ïœ ïœ ïœ ïœ ïœ |
|---|
| 547 |
ïœ |
|---|
| 548 |
ïœ ïœ ïœ ïœ ïœ ïœ ïœ ïœ ïœ ïœ ïœ ïœ ïœ ïœ ïœ ïœ ïœ ïœ ïœ ïœ ïœ ïœ ïœ ïœ ïœ¡            |
|---|
| 549 |
ïœ ïœ®                  ïŸ ïŸ ïŸ ... |
|---|
| 550 |
"""), |
|---|
| 551 |
(u'Specials', |
|---|
| 552 |
u""" |
|---|
| 553 |
"""), |
|---|
| 554 |
(u'Specials', |
|---|
| 555 |
u"""ᅵ |
|---|
| 556 |
"""), |
|---|
| 557 |
] |
|---|
| 558 |
|
|---|
| 559 |
documents = dict([(doc.uri, doc) for doc in |
|---|
| 560 |
[Document(uri=u'mock://%s' % lang, content=content, changed=i) |
|---|
| 561 |
for i, (lang, content) in enumerate(corpus)]]) |
|---|