پایان مرحلهٔ سوم بازبینی خروجیهای OCR

۸ بهمن ۱۳۸۹

مرحلهٔ سوم بازبینی خروجیهای OCR که شامل بازبینی ۶۴۱۱ خط شعر (و نثر توضیحی) بریده شده از دیوان قاآنی (باقیماندهٔ اشعار او شامل غزلیات، اشعار ترکیبی، قطعات و رباعیات) بود با ۱۹۷۸۶ مورد بازبینی پایان یافت. در این مرحله بیش از ۹۴ درصد تصاویر حداقل سه بار بازبینی شده‌اند (۳۴۴ مورد دو بار، ۱۰۲۹ مورد بیش از سه بار و باقی دقیقاً سه بار بازبینی شده‌اند).

در مجموع ۱۱۴۶ آی.پی مستقل از دوستانی که در این مرحله مشارکت کرده‌اند به ثبت رسیده است. نمودارهای زیر روند بازبینی را در بازهٔ زمانی یک ماههٔ این مرحله نشان می‌دهند.

نمودار آماری بازبینیها
جدول کشورهای دوستان مشارکت کننده در بازبینی

با پایان این مرحله در مجموع حدود ۲۰۵۰۰ بیت شعر از قاآنی در سایت در دسترس قرار گرفته است (اشعار قاآنی در گنجور) و کار ما با دیوان قاآنی تمام شده است. در میان خروجیها بعضاً متون توضیحی راجع به واژه‌های مشکل نیز وجود داشته که این موارد نیز به مرور در قالب حاشیه‌ها به سایت اضافه خواهند شد.

نسخهٔ مخصوص گنجور رومیزی از این نشانی قابل دریافت است. توضیح لازم آن که به دلیل مشکلات پیش آمده برای سایت میزبان گنجور رومیزی، فعلاً به دلیل دسترسی محدودم به امکانات این سایت، امکان به‌روزرسانی فهرست شعرهای جدید (برای یافتن نشانی دریافت از طریق اجرای فرمان «دریافت فهرست مجموعه‌های اشعار» از منوی «مجموعه‌ها»ی برنامه) را ندارم و پس از حل این مشکلات این فهرست را نیز به‌روز خواهم کرد.

مرحلهٔ چهارم بازبینی خروجیهای OCR با در دسترس قرار گرفتن ۴۵۷۵۹ تصویر از دیوان ملک‌الشعرای بهار (که در حال حاضر تنها حدود ۱۰۰۰ بیت از اشعارش در گنجور در دسترس است) از چهارم بهمن‌ماه آغاز شده است.

۱۲ نظر برای “پایان مرحلهٔ سوم بازبینی خروجیهای OCR”

  1. مهدی گفته:

    سلام
    آدرس دانلود فایل قاانی فیلتر شده است

  2. مهدی گفته:

    الان دارم با کمک فیلتر شکن دانلود میکنم با خود سایت فیلترینگ تماس بگیرید قبلا هم این مشکل پیش آمده بود

  3. مهدی گفته:

    مثل این که از دایره فیلتر خارج شده چون قبل این دیتا بیس و با فیلتر شکن دانلود کردم

  4. م گفته:

    در برخی موارد پرسیده میشود که کدام متن صحیح است
    لطفا در این موارد محل اختلاف دو متن را با رنگ دیگری نمایش دهید که کاربر اختلاف دو متن را سریعتر پیدا کند
    مرسی

  5. حمیدرضا گفته:

    @م:
    ایدهٔ بسیار خوبیه، سعی می‌کنم اگه فرصت مناسب پیش بیاد اضافه کنم چنین قابلیتی رو.

  6. مهران گفته:

    من با وی پی ان اینکار رو انجام می دم، آیا آی پی انگلستان محسوب می شم؟

  7. ساسان گفته:

    فوق العاده ستودنی هست کاری که کردید!
    من تازه با سایتتون آشنا شدم و الآن حدوده ۱ ساعت هست دارم اشعار رو تصحیح میکنم.
    کمترین کمکی هست که میتونم انجام بدم.
    کاش میتونستم حمایت مالی هم از این کار کنم

  8. موج گفته:

    فقط اگه یه صفحه برای ثبتنام هم میذاشتین که هر کس یه اکانت کاربری داشته باشه و بدونه چند خط رو اصلاح کرده بهتر میشد
    با سپاس

  9. غلام. HATE گفته:

    احسنت

  10. حامد گفته:

    خیلی نهضت بزرگ و قابل تحسینی راه اندازی کردید ای کاش برای دوستادارانتون هم امکان ساخت اکانت بگذارین تا هر کس از اوضاع کار خودش با خبر باشه و همینطور بین اکانتها ارتباط برقرار کنین تا باعث افزایش دوستی و ایجاد آشنائی ادبی باشین

  11. همایون گفته:

    تلاشتون فوق العاده است. دست همگی درد نکنه. یک سوال دارم؟ بعضی جاها اشتباه OCR هنوز وجود داره, بعضی جاها هم یه چیزایی تکراریه یا از قلم افتاده, مثلا در شعر عقاب دکتر خانلری. چطور میشه اصلاحش کرد؟

  12. حسن باقـــــــــــري گفته:

    سلام علیکم ورحمت الله
    واقعا چه اقدام نیکی و ابتکار جالبی بالاخص که درکمال زیبائی ، ظرافت ،سلیقه و هنر انجام گرفته است . ایضا آثار ارزنده ای را هم گردآوری نموده اید . خداوندتان یار باد و نگهدار ودامنه فعالیتتان هر چه گسترده تـر باد . حقیر نیز گرچه دراین وادی بسیاربی بضاعت است ولی از خداوندسبحان میخواهم مددی فرماید حد اقل کسب فیضی بنمایم .
    بامید موفقیت هر چه بیشترتان حسن باقـــــری

نظرتان را بنویسید