گزارش میاندوره‌ای روند بازبینی خروجیهای OCR دیوان ملک‌الشعرای بهار

20 می 2011

حدود چهار ماه از آغاز بازبینی خروجیهای OCR دیوان ملک‌الشعرای بهار می‌گذرد. همچنان که پیشتر اشاره شده بود در این گام ۴۵۷۵۹ تصویر بریده و OCR شده از دیوان ملک‌الشعرای بهار (که در حال حاضر تنها حدود ۱۰۰۰ بیت از اشعارش در گنجور در دسترس است) برای بازبینی در دسترس قرار گرفته است.

تا به حال و پس از گذشت نزدیک به چهار ماه، ۷۱۳۰۲ مورد بازبینی روی این تصاویر صورت گرفته که سهم ۲۰۴۰۱ تکه (حدود ۴۵ درصد) از تصاویر کمتر از دو بار، سهم ۲۳۳۹۳ تکه (۵۱ درصد) دقیقاً دو بار و سهم ۱۹۶۵ مورد (۴ درصد) سه بار و بیشتر بازبینی بوده است. پایان بازبینی زمانیست که اکثریت تصاویر حداقل سه بار بازبینی شده باشند و با روند کنونی به نظر می‌رسد تا آن زمان سه یا چهار ماه دیگر فاصله داشته باشیم.

تعداد ۴۵۶۱ آی.پی مجزا برای بازبینها به ثبت رسیده است. تصاویر زیر نشانگر آمار ثبت شده برای بازدیدها از سیستم بازبینی توسط سیستم آمارگیری گوگل است:

نمودار آماری بازبینیها
جدول کشورهای دوستان مشارکت کننده در بازبینی

از دوستانی که با این شیوه دقایقی از وقت روزانه‌شان را به ادبیات فارسی اهدا می‌کنند بار دیگر به سهم خودم تشکر می‌کنم.

۹ نظر برای “گزارش میاندوره‌ای روند بازبینی خروجیهای OCR دیوان ملک‌الشعرای بهار”

  1. مجتبی اصلاحی گفته:

    ما باید تشکر … تشکر

  2. علی گفته:

    سلام
    حمید رضای عزیز! به نظر می رسد سایت شما غیر قابل دسترس و مسدود شده باشه.
    من با فیلترشکن اومدم.خواهش می کنم پی گیری کنید که آیا دلیلی داره که یک سایت ارزشمند فرهنگی رو که خیلی از محققین و اساتید محترم حوزه و دانشگاه از آن استفاده می کنند،ببندند؟
    به نظرم می رسه که احتمالا اشتباهی این کار انجام شده و ان شاء الله به زودی مشکل برطرف بشه و گرنه باید به حال خود گریه سر داد.

  3. حمیدرضا گفته:

    @علی:
    فکر نمی‌کنم اشتباهی در کار باشه و این بار عامدانه فیلتر شده. اینجا را ببینید:
    http://www.gozir.com/1390/03/01/ganjoor-is-cencored-in-iran
    پیشتر پیش آمده بود که زیربخشهایی از سایت (مثلاً غزلیات اوحدی) اشتباهاً فیلتر بشن (دو سه بار)، در جواب پیگیریهای اون مورد هیچوقت اطلاعات شجره‌نامه‌ی منو 😉 نمی‌خواستن و بدون این که جوابی بدن مشکل حل می‌شد.

  4. abbas گفته:

    سلام خسته نباشید. ممنون از مجموعه ای که در اختیار دوستداران به ادبیات گذاشته اید. آقای محمدی شما همه کارها را انجام دادید ولی شعرهایی که در این نرم افزار قرار گرفته ، بدون ذکر صفحه و انتشارات و تصحیح کننده می باشد لطفا اگر می توانید صفحات مربوط به اشعار شاعران همراه با انتشارات و مصحح به نرم افزار اضافه کنید.
    من خودم دانشجوی ادبیات فارسی هستم الان دو سال هست که از نرم افزار شما استفاده می کنم ولی همیشه برای ذکر منبع و صفحات اشعار با مشکل روبرو شدم.
    از اینکه به جامعۀ ادبیات خدمت می کنید کمال تشکر را دارم و امیدوارم که همیشه در زندگی خود موفق باشید.

  5. بابک ونداد گفته:

    دم شما گرم. کارستان می‌کنید.
    از چه نرم‌افزاری برای OCR متن استفاده می‌کنید؟

  6. الهه گفته:

    یه خسته نباشید بزرگ برای آدم‌های بزرگ که دارن برای حفظ ادبیات ایران زمین تلاش می‌کنند.

  7. سعید شریفی گفته:

    سلام
    کار شما واقعا قابل توجه و احترام است
    موفق باشید

  8. Ara گفته:

    سلام
    خسته نباشید

    چرا از ایده captchia استفاده نمی کنید

    و سرویسی برای سایت ها اماده نمی کنید تا برای کارهای که می خواهند ماشین بودن کاربر را چک کنند از سایت شما استفاده کنند

  9. alitadayon گفته:

    سعی می کنم که بیش تر در خدمت باشم
    امیدوارم بتوان این پروژه را به صورت موازی از طریق سایت های دیگر پیش برد

نظرتان را بنویسید (نکتهٔ مهم: اگر برای نوشتن حاشیه در مورد شعرها اینجا آمده‌اید اشتباه آمده‌اید و باید در خود سایت گنجور حاشیه بگذارید. نظرات بی‌ربط به این نوشته پاک می‌شوند.)