سیستم بازبینی چشمی خروجیهای او.سی.آر

۱۷ خرداد ۱۳۸۹

پیش‌تر اشاره کرده بودم که قصد دارم به کمک OCR دامنهٔ داده‌های موجود در گنجور را گسترش دهم و کار را هم با اضافه کردن کتاب کوچکی از سنایی غزنوی، قسمتی از غزلیات بیدل دهلوی و چند قصیده از قاآنی شروع کرده بودم.

قبلاً هم گفته بودم که اضافه کردن اشعار با استفاده از OCR، غیر از امکانات و زمانی که برای اسکن و اجرای پردازش OCR روی ورودیها و دریافت خروجی نیاز دارد نیاز به یک کار چشمی پر زحمت دارد تا دقت خروجیها به سطح قابل قبول برسد. گفته بودم که برنامه‌ای دارم برای آن که علاقمندان گنجور را در این کار به همیاری دعوت کنم و با استفاده از مشارکت آنها سرعت و دقت گسترش دامنهٔ داده‌ها افزایش یابد.

الان، طرح ساده‌ای آماده کرده‌ام برای آن که به کمک آن این امر را محقق کنم. علاقمندان با مراجعه به این نشانی می‌توانند با بازبینی خروجیهای OCR به گسترش دامنهٔ داده‌های گنجور کمک کنند. سیستم طراحی شده بر اساس تعداد رأیهای کاربران به متون کار می‌کند و نهایتاً با غربال پررأی‌ترین گزینه‌ها خروجیها را تولید خواهم کرد. اگر اشتباه کردید: اشتباه تایپی یا انتخاب اشتباه، نگران نباشید! علاقمندان دیگر نیز خروجیها را می‌بینند و اشتباه شما را با رأیهایشان به متون درست‌تر تصحیح می‌کنند. فقط لطفاً در صورتی که صفحه‌کلید فارسی ندارید در این کار مشارکت نکنید! ورود متون به صورت فارگلیسی هیچ کمکی نمی‌کند.

بازبینی چشمی خروجیهای OCR

فعلاً خروجیهای باقیماندهٔ جلد اول غزلیات بیدل دهلوی در این سیستم در دسترس قرار دارند و به زودی باقیماندهٔ دیوان قاآنی را نیز در این سیستم در معرض بازبینی علاقمندان قرار می‌دهم.

۲۰۱ نظر برای “سیستم بازبینی چشمی خروجیهای او.سی.آر”

  1. مسود گفته:

    با دروود.
    این خیلی خوب‌ه.
    در زمینه‌های دیگه هم می‌شه هم‌یاری کرد. برای مثال صدا. اگر بشه گسترش‌دهنده‌گان گنجور برنامه‌ای تدارک ببینن که بتونه صدای خوانش یه شعر رو از روی سکون‌هایی که بین مصراع‌ها و بیت‌ها هست تشخیص بده و برش بزنه. می‌شه مجموعه‌ای درست کرد تا صدا‌های خوانش اشعار فارسی که دوستان زحمت کشیدن و ذخیره کردن رو با بیت معادلش برای بررسی برابری تو یه همچین جایی قرار بده و بعد اهل ذوق و اهل فن در اون مورد نظر بدن یا اگر لازم شد ضدا در اون مورد جای‌گزین بشه
    البته اگر در آینده زبان فارسی هم بتونه برای خودش هوش‌مصنوعی پیش‌رفته‌ای داشته باشه که بتونه متن رو خودش بخونه خیلی عالی خواهد بود. ولی تا اون روز باید تلاش کرد.

    بسیار سپاس از تیم گنجور

نظرتان را بنویسید