commit 0134ecc2e136b2c595ac166995590a73ac7f20e9
parent 3e7caf3978c6756444a4e3f3b4448c595d1ec43f
Author: lumidify <nobody@lumidify.org>
Date: Fri, 3 Apr 2020 11:11:58 +0200
Update data files (especially for hi->ur)
Diffstat:
13 files changed, 112 insertions(+), 40 deletions(-)
diff --git a/config.hi_ur b/config.hi_ur
@@ -5,10 +5,10 @@ beforeword "[-?,;।\s\\۔،؟!—‘’“”:؛()[\]{}%]"
afterword "[-?,;।\s\\۔،؟!—‘’“”:؛()[\]{}%]"
ignore "data/ignore.txt"
-table misc_beginword "data/misc_beginword.txt" nodisplay revert
+table misc_beginword.hi_ur "data/misc_beginword.hi_ur.txt" nodisplay revert
table misc_endword "data/misc_endword.txt" nodisplay revert
-table special "data/special.txt" nodisplay revert
-
+table special.hi_ur "data/special.hi_ur.txt" nodisplay revert
+table be.hi_ur "data/be.hi_ur.txt" revert
# Verbs
@@ -81,29 +81,34 @@ expand na_ui_oi_ai_mascfem na_ui_oi_ai_mascfem_forms noroot
# Conversion rules
-match "(?<=ی) و " "ओ-"
-match "(?<=[ہی])ٔ" "ए-" endword
-match "(?<=[ہی])ِ" "ए-" endword
-match "(?<=ا) و " "ओ-"
-match "(?<=[0123456789])واں" "वाँ"
-match "(?<=[0123456789])ویں" "वें$वीं"
-match "(?<=[0123456789])ء" " ई."
-match "(?<![0123456789]):" " :"
+group
+replace special.hi_ur
+endgroup
+
+group beginword endword
+replace be.hi_ur
+endgroup
+
+match "(?<=ी)ओ-" " و "
+match "(?<=ा)ए-" "ٔ "
+match "(?<=ी)ए-" "ِ "
+match "(?<=ा)ओ-" " و "
+match "(?<=[0123456789])वाँ" "واں" endword
+match "(?<=[0123456789])वें" "ویں" endword
+match "(?<=[0123456789])वीं" "ویں" endword
+match "(?<=[0123456789]) ई." "ء" endword
+match "(?<![0123456789]) :" ":" endword
matchignore "[0123456789]+" beginword endword
group beginword
-replace misc_beginword
+replace misc_beginword.hi_ur
endgroup
group endword
replace misc_endword
endgroup
-group
-replace special
-endgroup
-
group beginword endword
replace na_ifemshort
replace na_adjectiveregular_a_i
@@ -130,3 +135,5 @@ endgroup
group
replace punctuation
endgroup
+
+targetdiacritics "ُ" "ِ" "ّ" "َ"
diff --git a/config.ur_hi b/config.ur_hi
@@ -5,9 +5,9 @@ beforeword "[-\s\\۔،؟!—‘’“”:؛()[\]{}%]"
afterword "[-\s\\۔،؟!—‘’“”:؛()[\]{}%]"
ignore "data/ignore.txt"
-table misc_beginword "data/misc_beginword.txt" nodisplay
+table misc_beginword.ur_hi "data/misc_beginword.ur_hi.txt" nodisplay
table misc_endword "data/misc_endword.txt" nodisplay
-table special "data/special.txt" nodisplay
+table special.ur_hi "data/special.ur_hi.txt" nodisplay
# Verbs
@@ -93,7 +93,7 @@ match "(?<![0123456789]):" " :"
matchignore "[0123456789]+" beginword endword
group beginword
-replace misc_beginword
+replace misc_beginword.ur_hi
endgroup
group endword
@@ -101,7 +101,7 @@ replace misc_endword
endgroup
group
-replace special
+replace special.ur_hi
endgroup
group beginword endword
diff --git a/data/be.hi_ur.txt b/data/be.hi_ur.txt
@@ -0,0 +1,19 @@
+آمنے سامنے आमने-सामने
+بیٹا बेटा
+بیٹے बेटे
+بیتوں बेटों
+بیٹی बेटी
+بیٹیاں बेटियाँ
+بیٹیوں बेटियों
+بہتر बेहतर
+بہترین बेहतरीन
+بیروتا बेरोता
+بیریہ बेरिया
+بیل شضر बेलशज़्ज़र
+بیل شَضَر बेलशज़्ज़र
+بیل طشَضَر बेलशज़्ज़र
+بیواؤں बेवाओं
+بیوائیں बेवाएँ
+بیوہ बेवा
+لمبے چوڑے लंबे-चौड़े
+
diff --git a/data/misc_beginword.hi_ur.txt b/data/misc_beginword.hi_ur.txt
@@ -0,0 +1,2 @@
+بے बे
+غیر ग़ैर
diff --git a/data/misc_beginword.txt b/data/misc_beginword.ur_hi.txt
diff --git a/data/nouns_adjectives/ahmasc.txt b/data/nouns_adjectives/ahmasc.txt
@@ -147,7 +147,7 @@
خط ख़ित्त
خِط ख़ित्त
خلاص ख़ुलास
-خواج ख़्वाज
+خواج ख़ाज
خوج ख़ोज
خودساخت ख़ुदसाख़्त
خورد ख़ुरद
diff --git a/data/nouns_adjectives/cfem.txt b/data/nouns_adjectives/cfem.txt
@@ -359,8 +359,8 @@
خلوت खलवत
خلیج ख़लीज
خندق ख़ंदक़
-خواب گاہ ख़्वाबगाह
-خواہش ख़्वाहिश
+خواب گاہ ख़ाबगाह
+خواہش ख़ाहिश
خوراک ख़ुराक
خوشامد ख़ुशामद
خیریت ख़ैरियत
diff --git a/data/nouns_adjectives/cmasc.txt b/data/nouns_adjectives/cmasc.txt
@@ -818,9 +818,9 @@
خمیر ख़मीर
خم ख़म
خنجر ख़ंजर
-خواب ख़्वाब
-خوار ख़्वार
-خواہش مند ख़्वाहिशमंद
+خواب ख़ाब
+خوار ख़ार
+خواہش مند ख़ाहिशमंद
خوب صورت ख़ूबसूरत
خوبصورت ख़ूबसूरत
خود اعتماد ख़ुदएतमाद
@@ -1314,7 +1314,7 @@
شیخ शेख़
شیر ببر शेर-बबर
شیرببر शेरबबर
-شیرخوار शीरख़्वार
+شیرخوار शीरख़ार
شیر دل शेरदिल
شیر शेर
شیطان शैतान
@@ -1536,7 +1536,7 @@
قانون क़ानून
قبرستان क़ब्रिस्तान
قبیح क़बीह
-قتل क़तल
+قتل क़त्ल
قحط कह्त
قدر क़दर
قدم क़दम
@@ -1547,7 +1547,7 @@
قرار क़रार
قربان क़ुरबान
قرب क़ुर्ब
-قرض خواہ क़र्ज़ख़्वाह
+قرض خواہ क़र्ज़ख़ाह
قرض دار क़र्ज़दार
قریب تر क़रीबतर
قریب क़रीब
@@ -1983,7 +1983,7 @@
معبود माबूद
معتبر मोतबर
معتقد मोतक़िद
-معذرت خواہ माज़रत-ख़्वाह
+معذرت خواہ माज़रत-ख़ाह
معذور माज़ूर
معزز मुअज़्ज़ज़
معصوم मासूम
@@ -2138,6 +2138,7 @@
مینیجر मैनेजर
نائب नायब
نااُمید ना-उम्मीद
+ناامید ना-उम्मीद
ناانصاف ना-इनसाफ़
نابود नाबूद
ناپائیدار ना-पायदार
@@ -2330,3 +2331,5 @@
یقین यक़ीन
یک دل यकदिल
یوم यौम
+مُقدر मुक़द्दर
+مُقدّر मुक़द्दर
diff --git a/data/nouns_adjectives/ifem.txt b/data/nouns_adjectives/ifem.txt
@@ -341,7 +341,7 @@
خنجر ख़ंजर
خندہ پیشان ख़ंदापेशान
خنک ख़ुनक
-خواب ख़्वाब
+خواب ख़ाब
خوبصورت खूबसूरत
خوب صورت ख़ूबसूरत
خوب ख़ूब
@@ -801,7 +801,7 @@
واپس वापस
واد वाद
ورد वरद
-وظیفہ خوان वज़ीफ़ाख़्वान
+وظیفہ خوان वज़ीफ़ाख़ान
وفادار वफ़ादार
وقوف वुक़ूफ
یاددہان याददिहान
diff --git a/data/nouns_adjectives/irregular.txt b/data/nouns_adjectives/irregular.txt
@@ -529,7 +529,7 @@
اسکریوتی इस्करियोती
اسکندریہ इस्कंदरिया
اسکہ इसका
-اِسکہ इसका
+اِسکہ इस्का
اس کو इसको
اِس کو इसको
اس کو उसको
@@ -2613,10 +2613,10 @@
خمسہ ख़मसा
خنک ख़ुनुक
خواتین ख़वातीन
-خواہاں ख़्वाहाँ
-خواہشات ख़्वाहिशात
-خواہ مخواہ ख़्वाहमख़्वाह
-خواہ ख़्वाह
+خواہاں ख़ाहाँ
+خواہشات ख़ाहिशात
+خواہ مخواہ ख़ाहमख़ाह
+خواہ ख़ाह
خوبہ ख़ूबा
خوب ख़ूब
خوتام ख़ूताम
@@ -5031,7 +5031,7 @@
مجموعی मजमुई
مجموعے मजमुए
مجموع मजमुआ
-مجھ سے मझसे
+مجھ سے मुझसे
مجھ کو मुझको
مجھ ہی मुझी
مجھے मुझे
@@ -5560,7 +5560,7 @@
نخشتان नख़ुश्तान
نخُشتان नख़ुश्तान
نخلامی नख़लामी
-نخواستہ नख़्वास्ता
+نخواستہ नख़ास्ता
نداب नदाब
ندبیاہ नदबियाह
ندب नदब
@@ -6202,3 +6202,22 @@
یویریب यूयारीब
یویقیم यूयक़ीम
ے ये
+ابی مَلک अबीमलिक
+سُوتونیس सूतोनियुस
+سوتونِیس सूतोनियुस
+سُوتونِیُس सूतोनियुस
+اُس میں उसमें
+اِس میں इसमें
+مجھ میں मुझमें
+تجھ میں तुझमें
+ہم میں हममें
+تم میں तुममें
+اُن میں उनमें
+اِن میں इनमें
+جس میں जिसमें
+جن میں जिनमें
+کس میں किसमें
+کن میں किनमें
+سب میں सबमें
+بر बर्र
+بنا बिना
diff --git a/data/nouns_adjectives/o_a_staysmasc.txt b/data/nouns_adjectives/o_a_staysmasc.txt
@@ -9,7 +9,7 @@
حیا हया
خدا ख़ुदा
خلا ख़ला
-خواجہ سرا ख़्वाजासरा
+خواجہ سرا ख़ाजासरा
دانا दाना
دروغ گو दरोग़गो
دریا दरिया
diff --git a/data/special.hi_ur.txt b/data/special.hi_ur.txt
@@ -0,0 +1,22 @@
+ِ े-
+ و ो-
+ذرائعِ ज़राएये-
+انبیائے अंबियाए-
+دریائے दरियाए-
+خدائے ख़ुदाए-
+عصائے असाए-
+سزائے सज़ाए-
+ایشیائے एशियाए-
+دعائے दुआए-
+علمائے उलमाए-
+کارہائے कारहाए-
+ماورائے मावराए-
+اِبتدائے इब्तिदाए-
+ابتدائے इब्तिदाए-
+بنائے बनाए $बिनाए-
+گھبرائے घबराए
+برائے बराए-
+رُوئے زمین रूए-ज़मीन
+اشیائے अश्याए-
+ سالہ -साला
+ با बा-
diff --git a/data/special.txt b/data/special.ur_hi.txt