Korpusa deqên bi kurdiya soranî ya Asosoftê: Cudahiya di navbera guhartoyan de

Content deleted Content added
Balyozbot (gotûbêj | beşdarî)
B →‎top: --Şablon:Bikaranîna dîroka rms AWB
Etîket: Betalkirina destî
Rescuing 1 sources and tagging 0 as dead.) #IABot (v2.0.8.1
Rêz 2:
 
== Tekstên korpusê ==
Deqên vê korpusê ji malperan, navendên havalnêrî, pirtûk, kovar û hwd hatine komkirin. Beşek ji belgenameyên korpusê bi leybilê babetan (''topic tags'') hatine destnîşankirin û vekolîner dikarin van taybetmendiyan ji bo karên venasînên babetan (''topic identification'') bi kar bînin. Her weha, ew korpus bo karên dinên [[pêvajoya zimanê siruştî]] wek [[venasîna axaftinê]] (''speech recognition'') û deranîna [[modela zimên]] (''language model'') û [[wişedank]]ê (''lexicon'') tê bikaranîn <ref>Hadi Veisi, Mohammad MohammadAmini, Hawre Hosseini; Toward Kurdish language processing: Experiments in collecting and processing the AsoSoft text corpus, Digital Scholarship in the Humanities, , fqy074, https://doi.org/10.1093/llc/fqy074</ref><ref>{{Citation |title=Kopîkirina arşîvê |url=http://asosoft.com/en/works/textcorpus |access-date=2019-03-16 |archive-date=2019-03-09 |archive-url=https://web.archive.org/web/20190309013231/http://asosoft.com/en/works/textcorpus/ |url-status=dead }}</ref><ref>https://github.com/AsoSoft/AsoSoft-Text-Corpus</ref>..
 
== Taybetmendiyên giştî yên korpusê ==