commit b01c2c622f6531dfec33d849cd18969727e56ff2
parent 0134ecc2e136b2c595ac166995590a73ac7f20e9
Author: lumidify <nobody@lumidify.org>
Date: Sun, 5 Apr 2020 15:28:09 +0200
Update data files
Diffstat:
16 files changed, 98 insertions(+), 67 deletions(-)
diff --git a/ExplanationForAdditionalFilesInHindiUrduTransliteration b/ExplanationForAdditionalFilesInHindiUrduTransliteration
@@ -0,0 +1,12 @@
+In the HindiToUrdu transliteration,the order of tables has been rearranged in the list and a new table 'pairs.hi_ur' has been added.
+
+One problem is the بے, which is converted to बे. When converting back, the program cannot recognize if it is a بے as in بےشک (बेशक)or بی as in بیٹا (बेटा).
+
+Therefore misc_beginword.hi_ur.txt containing the بے replacement has been shifted to after replacement of the group of tables comprising of adjective_nouns and verbs.
+
+However, now it unable to find words such as बेशक; although शक is in the nouns_adjectives/cmasc.txt file, it is not recognized because it begins with बे.
+
+Another problematic rule is the Persian Genetive े- (मुल्के-मिसर), which conflicts with word pairs containing this such as नवासे-नवासियाँ. These word pairs are regular inflections and do not contain a Persian Genetive, so in Urdu script the first word of the pair ends in ے + space and not ِ + space.
+
+Therefore word pairs conflicting with the Persian Genetive have been put into the new file 'pairs.hi_ur'.
+
diff --git a/config.hi_ur b/config.hi_ur
@@ -8,7 +8,7 @@ ignore "data/ignore.txt"
table misc_beginword.hi_ur "data/misc_beginword.hi_ur.txt" nodisplay revert
table misc_endword "data/misc_endword.txt" nodisplay revert
table special.hi_ur "data/special.hi_ur.txt" nodisplay revert
-table be.hi_ur "data/be.hi_ur.txt" revert
+table pairs.hi_ur "data/pairs.hi_ur.txt" nodisplay revert
# Verbs
@@ -81,14 +81,6 @@ expand na_ui_oi_ai_mascfem na_ui_oi_ai_mascfem_forms noroot
# Conversion rules
-group
-replace special.hi_ur
-endgroup
-
-group beginword endword
-replace be.hi_ur
-endgroup
-
match "(?<=ी)ओ-" " و "
match "(?<=ा)ए-" "ٔ "
match "(?<=ी)ए-" "ِ "
@@ -101,14 +93,18 @@ match "(?<![0123456789]) :" ":" endword
matchignore "[0123456789]+" beginword endword
-group beginword
-replace misc_beginword.hi_ur
+group beginword endword
+replace pairs.hi_ur
endgroup
group endword
replace misc_endword
endgroup
+group
+replace special.hi_ur
+endgroup
+
group beginword endword
replace na_ifemshort
replace na_adjectiveregular_a_i
@@ -132,6 +128,29 @@ replace verbs_regular_consonant_ending
replace verbs_regular_ending_in_a_o
endgroup
+group beginword
+replace misc_beginword.hi_ur
+endgroup
+
+group beginword endword
+replace na_ifemshort
+replace na_adjectiveregular_a_i
+replace na_irregular
+replace na_ahmasc
+replace na_aimasc
+replace na_amasc
+replace na_an
+replace na_cfem
+replace na_cmasc
+replace na_ifem
+replace na_imasc
+replace na_o_a_staysfem
+replace na_u_staysfem
+replace na_o_a_staysmasc
+replace na_u_staysmasc
+replace na_ui_oi_ai_mascfem
+endgroup
+
group
replace punctuation
endgroup
diff --git a/config.ur_hi b/config.ur_hi
@@ -9,7 +9,6 @@ table misc_beginword.ur_hi "data/misc_beginword.ur_hi.txt" nodisplay
table misc_endword "data/misc_endword.txt" nodisplay
table special.ur_hi "data/special.ur_hi.txt" nodisplay
-
# Verbs
table verbs_irregular "data/verbs/irregular.txt"
diff --git a/data/be.hi_ur.txt b/data/be.hi_ur.txt
@@ -1,19 +0,0 @@
-آمنے سامنے आमने-सामने
-بیٹا बेटा
-بیٹے बेटे
-بیتوں बेटों
-بیٹی बेटी
-بیٹیاں बेटियाँ
-بیٹیوں बेटियों
-بہتر बेहतर
-بہترین बेहतरीन
-بیروتا बेरोता
-بیریہ बेरिया
-بیل شضر बेलशज़्ज़र
-بیل شَضَر बेलशज़्ज़र
-بیل طشَضَر बेलशज़्ज़र
-بیواؤں बेवाओं
-بیوائیں बेवाएँ
-بیوہ बेवा
-لمبے چوڑے लंबे-चौड़े
-
diff --git a/data/nouns_adjectives/ahmasc.txt b/data/nouns_adjectives/ahmasc.txt
@@ -401,7 +401,7 @@
مظاہر मुज़ाहर
معائن मुआयन
معاشر मुआशर
-معاف شد मुआफ़शुद
+معاف شد माफ़शुद
معالج मुआलज
معامل मामल
معاہد मुआहद
@@ -475,3 +475,4 @@
وعد वाद
وقف वक़्फ़
یتیم خان यतीमख़ान
+عوضان एवज़ान
diff --git a/data/nouns_adjectives/cfem.txt b/data/nouns_adjectives/cfem.txt
@@ -266,7 +266,7 @@
جان जान
جاہ जाह
جدل जदल
-جرأت जुरअत
+جرأت जुर्रत
جراحت जर्राहत
جڑ जड़
جسامت जसामत
@@ -484,7 +484,7 @@
سازش साज़िश
سازِش साज़िश
ساس सास
-سال گرہ साल-गिरह
+سال گرہ सालगिरह
سالمیت सालिमियत
ساہول साहूल
سبقت सबक़त
@@ -919,3 +919,6 @@
یکسانیت यकसानियत
یگانگت यगांगत
یہودیت यहूदियत
+ناؤ नाव
+بھیک भीख
+پھٹکار फटकार
diff --git a/data/nouns_adjectives/cmasc.txt b/data/nouns_adjectives/cmasc.txt
@@ -574,7 +574,7 @@
توہم तवह्हुम
تیار तैयार
تیتر तीतर
-تیرانداز तीर-अंदाज़
+تیرانداز तीरंदाज़
تیر तीर
تیزتر तेज़तर
تیز رفتار तेज़रफ़्तार
@@ -617,7 +617,7 @@
جج जज
جدید जदीद
جذبات انگیز जज़बात-अंगेज़
-جرأت مند जुरअतमंद
+جرأت مند जुर्रतमंद
جرم जुर्म
جُرم जुर्म
جرنیل जरनैल
@@ -836,7 +836,7 @@
خوش باش ख़ुशबाश
خوشبودار ख़ुशबूदार
خوش حال ख़ुशहाल
-خوش قسمت ख़ुशक़िस्मत
+خوش قسمت ख़ुशक़िसमत
خوش گوار ख़ुशगवार
خوش مزاج ख़ुशमिज़ाज
خوش نصیب ख़ुशनसीब
@@ -1133,7 +1133,7 @@
سبزہ زار सब्ज़ाज़ार
سبق सबक़
سپاہ سالار सिपाहसालार
-سپرد सपुर्द
+سپرد सुपुर्द
سپرنٹنڈنٹ सुपरिण्टेण्डेण्ट
سپہ سالار सिपहसालार
ستار सितार
@@ -1396,7 +1396,6 @@
عزم अज़म
عزیز अज़ीज़
عشق इश्क़
-عصا असा
عصب असब
عصر असर
عصمت فروش इसमतफ़रोश
@@ -2097,7 +2096,7 @@
مہربان मेहरबान
مہردار मोहरदार
مَہر महर
-مُہر मोहर
+مُہر मुहर
مہر मोहर$महर
مہک دار महकदार
مہلک मोहलक
diff --git a/data/nouns_adjectives/ifem.txt b/data/nouns_adjectives/ifem.txt
@@ -212,7 +212,7 @@
تُوڑ तूड़
توہم پرست तवह्हुमपरस्त
تیار तैयार
-تیرانداز तीर-अंदाज़
+تیرانداز तीरंदाज़
تیور त्योर
ثابت قدم साबितक़दम
ٹڈ टिड्ड
@@ -359,7 +359,7 @@
خوش بیان ख़ुशबयान
خوش حال ख़ुशहाल
خوش خبر ख़ुशख़बर
-خوش قسمت ख़ुशक़िस्मत
+خوش قسمت ख़ुशक़िसमत
خوش گپ ख़ुश-गप्प
خوش مزاج ख़ुशमिज़ाज
خوش نصیب ख़ुशनसीब
@@ -710,7 +710,7 @@
مستعد मुस्तैद
مست मस्त
مضبوط मज़बूत
-معاف मुआफ़
+معاف माफ़
معمور मामूर
معمول मामूल
مفلس मुफ़लिस
diff --git a/data/nouns_adjectives/irregular.txt b/data/nouns_adjectives/irregular.txt
@@ -615,6 +615,7 @@
اشور بنی پال अशूरबनीपाल
اشیاء अशया
اشیا अशया
+عصا असा
اصبون इसबून
اِصبون इसबून
اصطلاحات इस्तिलाहात
@@ -1027,6 +1028,7 @@
اوفیر ओफ़ीर
اوقات औक़ात
اوگوستس औगुस्तुस
+لگ بھگ लगभग
اَوگوستُس औगुस्तुस
اولائی ऊलाई
اُولائی ऊलाई
@@ -1447,7 +1449,7 @@
بھی भी
بہاؤ बहाव
بہترین बेहतरीन
-بہر حال बहर हाल
+بہر حال बहरहाल
بہر बहर
بہل बहल
بہم बहम
@@ -1482,7 +1484,7 @@
بیت المقدس बैतुल-मुक़द्दस
بیت المُقدّس बैतुल-मुक़द्दस
بیت ایضل बैत-एज़ल
-بیت ایل बैत-एल
+بیت ایل बैतेल
بیت بارہ बैत-बारा
بیت بری बैत-बिरी
بیت بِری बैत-बिरी
@@ -4393,20 +4395,20 @@
قریب ترین क़रीबतरीन
قریتائم क़िरियतायम
قِریَتائم क़िरियतायम
-قریت اربع क़िरयत-अरबा
-قِریَت اربع क़िरयत-अरबा
-قریت بعل क़िरयत-बाल
-قِریَت بعل क़िरयत-बाल
-قریت حصات क़िरयत-हुसात
-قِریَت حصات क़िरयत-हुसात
-قریت سفر क़िरयत-सिफ़र
-قِریَت سِفر क़िरयत-सिफ़र
-قریت سنہ क़िरयत-सन्ना
-قِریَت سنّہ क़िरयत-सन्ना
-قریت یعریم क़िरयत-यारीम
-قِریَت یعریم क़िरयत-यारीम
-قریت क़िरयत
-قِریَت क़िरयत
+قریت اربع क़िरियत-अरबा
+قِریَت اربع क़िरियत-अरबा
+قریت بعل क़िरियत-बाल
+قِریَت بعل क़िरियत-बाल
+قریت حصات क़िरियत-हुसात
+قِریَت حصات क़िरियत-हुसात
+قریت سفر क़िरियत-सिफ़र
+قِریَت سِفر क़िरियत-सिफ़र
+قریت سنہ क़िरियत-सन्ना
+قِریَت سنّہ क़िरियत-सन्ना
+قریت یعریم क़िरियत-यारीम
+قِریَت یعریم क़िरियत-यारीम
+قریت क़िरियत
+قِریَت क़िरियत
قریح क़रीह
قریوت حصرون क़रियोत-हसरोन
قریوت क़रियोत
@@ -5220,7 +5222,7 @@
مطیع मुती
مظاہر मज़ाहर$मुज़ाहिर
معارہ मआरा
-معاف मुआफ़
+معاف माफ़
معاملات मामलात
معانی मानी
معترضین मोतरिज़ीन
@@ -6221,3 +6223,11 @@
سب میں सबमें
بر बर्र
بنا बिना
+بِنا बिना
+بِِن बिन
+کرامات करामात
+رب الکریم रब्बुल-करीम
+کرامات करामात
+سب ہی सभी
+رب العظیم रब्बुल-अज़ीम
+مسیحا मसीहा
diff --git a/data/nouns_adjectives/o_a_staysfem.txt b/data/nouns_adjectives/o_a_staysfem.txt
@@ -38,3 +38,4 @@
ہَوا हवा
وبا वबा
وفا वफ़ा
+گپھا गुफा
diff --git a/data/pairs.hi_ur.txt b/data/pairs.hi_ur.txt
@@ -0,0 +1,8 @@
+آمنے سامنے आमने-सामने
+بیٹا بیٹی बेटा-बेटी
+بیٹے بیٹیاں बेटे-बेटियाँ
+بیٹے بیٹیوں बेटे-बेटियों
+نواسے نواسیاں नवासे-नवासियाँ
+نواسے نواسیوں नवासे-नवासियों
+پوتے پوتیاں पोते-पोतियाँ
+پوتے پوتیوں पोते-पोतियों
diff --git a/data/special.hi_ur.txt b/data/special.hi_ur.txt
@@ -2,7 +2,7 @@
و ो-
ذرائعِ ज़राएये-
انبیائے अंबियाए-
-دریائے दरियाए-
+دریائے दरयाए-
خدائے ख़ुदाए-
عصائے असाए-
سزائے सज़ाए-
@@ -12,7 +12,6 @@
کارہائے कारहाए-
ماورائے मावराए-
اِبتدائے इब्तिदाए-
-ابتدائے इब्तिदाए-
بنائے बनाए $बिनाए-
گھبرائے घबराए
برائے बराए-
diff --git a/data/special.ur_hi.txt b/data/special.ur_hi.txt
@@ -19,4 +19,3 @@
اشیائے अश्याए-
سالہ -साला
با बा-
- بہ ब
diff --git a/data/verbs/irregular.txt b/data/verbs/irregular.txt
@@ -340,3 +340,5 @@
سہنے सहने
سہنی सहनी
سہئے सहिए
+مسیحا मसीहा
+جریکو जेरिको
diff --git a/data/verbs/regular_consonant_ending.txt b/data/verbs/regular_consonant_ending.txt
@@ -1,4 +1,3 @@
-
ابال उबाल
اُبال उबाल
ابل उबल
@@ -301,7 +300,7 @@
ڈھانک ढाँक
ڈھک ढक
ڈھل ढल
-ڈھونڈ ढ़ूँड
+ڈھونڈ ढूँड
ڈوب डूब
رچ रच
رَچ रच
@@ -494,3 +493,4 @@
ہڑپ हड़प
ہل हिल
ہنس हँस
+تھم थम
diff --git a/data/verbs/regular_ending_in_a_o.txt b/data/verbs/regular_ending_in_a_o.txt
@@ -167,8 +167,6 @@
دھمکا धमका
دھندلا धुँधला
دھو धो
-دہرایا दोहरा
-دُہرایا दोहरा
دہرا दोहरा
دُہرا दोहरा
دوڑا दौड़ा