پایان مرحلهٔ دوم بازبینی خروجیهای OCR

27 دسامبر 2010

مرحلهٔ دوم بازبینی خروجیهای OCR که شامل بازبینی ۳۳۱۶۰ خط شعر بریده شده از جلد دوم غزلیات بیدل بود با ۱۰۵۷۷۵ مورد بازبینی و در حالی پایان یافت که از لحاظ آماری، تعداد بازبینیها به ازای هر تصویر پراکندگی بسیار مناسبتری از مرحلهٔ اول دارد و در حالی که در مرحلهٔ قبل ۴۶ درصد موارد تنها یک بار بازبینی شده بودند، در این مرحله بیش از ۹۹ درصد تصاویر حداقل سه بار بازبینی شده‌اند (۲۶۹ مورد کمتر از سه بار، ۴۳۷۵ مورد بیش از سه بار و باقی دقیقاً سه بار بازبینی شده‌اند). ۵۳۵۰۷ مورد (حدود ۵۰ درصد)، همان متن OCR شده را بدون کوچکترین تغییری تأیید کرده‌اند (برای ۲۱۲۷۲ از ۳۳۱۶۰ تصویر یعنی ۶۴ درصد تصاویر)، ۳۵۰ مورد از تصاویر ناخوانا گزارش شده‌اند و ۶۹۰ تصویر «بد بریده شده» ثبت شده‌اند.

در مجموع ۴۲۳۱ آی.پی مستقل از دوستانی که مشارکت کرده‌اند به ثبت رسیده است. نمودارهای زیر روند بازبینی را نشان می‌دهند.


با پایان این مرحله، غزلیات بیدل دهلوی تقریباً به طور کامل (حدود ۳۲۳۳۰ بیت در قالب ۲۸۲۷ غزل) روی سایت در دسترس قرار گرفته است (صفحات معدودی از این کتاب در حین اسکن و بر اثر کشش همزمان چند برگه توسط اسکنر از قلم افتاده است و این مشکل را من در بازبینی نهایی متوجه شدم). این اشعار بر اساس حروف آخر روی از نو مرتب شده‌اند (ترتیب اولیهٔ نسخهٔ چاپی، بر اساس حرف آخر روی و سپس حروف ابتدایی غزل بود که عملاً بسیار ناکارآمد است).

تعداد زیاد غزلیات بیدل باعث شده صفحهٔ فهرست آنها سنگین شود که در فرصت مناسب همانند فهرست غزلیات شمس آن را به چند صفحهٔ مجزا می‌شکنم تا این مشکل حل شود.

نسخهٔ مخصوص گنجور رومیزی را پس از اعمال چند تغییر بر روی برنامه، جهت سازگاری بیشتر آن با ساغر و همینطور رفع مشکلی که در حال حاضر برای اضافه کردن مجموعه‌های شامل اشعار یک شاعر از پیش موجود وجود دارد ارائه خواهم کرد.

مرحلهٔ سوم بازبینی، برای ۶۴۱۲ تصویر از اشعار قاآنی (غزلیات، قطعات و سایر اشعار بعد از قصاید) از پنجشنبهٔ هفتهٔ پیش آغاز شده است.

از لطف و زحمت تمامی دوستانی که تا به حال در این کار مشارکت کرده‌‎اند بار دیگر و به سهم خودم تشکر می‌کنم.

۳ نظر برای “پایان مرحلهٔ دوم بازبینی خروجیهای OCR”

  1. ایوب محمودی گفته:

    با سلام

    خدا به شما عزیزان اجر بی نهایت بدهد… واقعا کارتان ستودنی است….

    یک سوال داشتم:

    با اینکه من دو هفته قبل نسخه گنجور را دانلود کرده ام نیازی هست دوباره آن را دانلود کنم تا همه اشعار بیدل دهلوی را که می گویید آماده کرده اید در برنامه گنجور داشته باشم یا باید کار دیگری انجام بدهم؟‍

    ممنون از زحماتتون

  2. بهرام گفته:

    سلام وبلاگ بسیار خوبی داری افرین بر شما من که خیلی لذت بردم چون هر شاعری که میخواستم در دسترس بود متشکرم بهرام

  3. بهنام گفته:

    کار خوبی است. در واقع هر کاری که برای زنده کردن مشاهیر ادب و هنر و علم این سرزمین مقدس انجام شود ستودنی است.
    واقعا خسته نباشید

نظرتان را بنویسید (نکتهٔ مهم: اگر برای نوشتن حاشیه در مورد شعرها اینجا آمده‌اید اشتباه آمده‌اید و باید در خود سایت گنجور حاشیه بگذارید. نظرات بی‌ربط به این نوشته پاک می‌شوند.)