گزارشی از روند پیشرفت بازبینی خروجیهای OCR

25 June 2010

در مرحلهٔ اول کار بازبینی چشمی خروجیهای OCR تعداد ۵۳۰۳۷ تکه تصویر متن بریده شده از جلد اول غزلیات بیدل و قصاید قاآنی در معرض بازبینی قرار گرفته که تا امروز با گذشت ۱۸ روز از فراخوان برای همکاری دوستداران ادبیات فارسی حدود ۴۷ درصد از این تصاویر (۲۴۸۵۲ تکه) حداقل یک بار بازبینی شده‌اند (۱۴ درصد از کل تصاویر بیش از یک بار بازبینی شده‌اند). آمار روزانهٔ بازبینیها از طریق این صفحه در دسترس قرار دارد.

تعداد ۲۳۰۷ آی.پی مجزا برای بازبینها به ثبت رسیده است. تصویر زیر نشانگر آمار ثبت شده برای بازدیدها از سیستم بازبینی توسط سیستم آمارگیری گوگل است:

آمار بازدیدهای از سیستم بازبینی خروجیهای OCR

جدول زیر آمار تفکیکی کشورهای بازدیدکننده‌ها را به ترتیب تعداد صفحات بازدید شده به ازای هر نفر نشان می‌دهد.

کشورهای بازدیدکنندگان

از همهٔ دوستانی که در این کار مشارکت کرده و می‌کنند تشکر می‌کنم. با روند فعلی به نظر می‌رسد تا در دسترس قرار گرفتن اولین خروجی این همکاری در سایت باید چیزی حدود یک ماه دیگر فاصله داشته باشیم. طبق برنامهٔ فعلی در مرحلهٔ دوم باقیماندهٔ غزلیات بیدل (جلد دوم) و دیوان قاآنی و احتمالاً در مرحلهٔ سوم دیوان کامل ملک‌الشعرای بهار برای بازبینی در دسترس قرار خواهند گرفت.

۲۵ نظر برای “گزارشی از روند پیشرفت بازبینی خروجیهای OCR”

  1. روشن گفته:

    دستان را به گرمی و با دوستی می فشارم.
    اقدام مهمی که در جهت حفظ فرهنگ و ادبیات ایران بر گردن گرفته اید، کاری هنردوستانه و ارجمند است.
    با تمام همت خود شما را یاری می کنم.
    زنده و جاوید باشید

  2. سعید گفته:

    با سپاس فراوان
    بسیار متشکریم از زحمات شما بسیار جالب بود فکر نمی کردم دیگه کسی به فکر فرهنگ و ادبیات پارسی باشه متاسفانه داشت به دست فراموشی سپرده می شد
    متشکرم
    پایدار و پیروز باشید
    به درود

  3. آرین گفته:

    خسته نباشید! کارتان عالی هست! دو تا از سه بازدیدی که از فلاند داشتید خودم بودم!

    با تشکر

  4. اميد گفته:

    سلام
    من هم سعی میکنم به نوبه‌ی خودم کمک کنم در تصحیح اشعار

    دمت گرم

  5. شهاب گفته:

    سلام
    واقعا خسته نباشید.
    کارتان فوق العاده است.
    من واقعا لذت بردم.
    اگر کمکی در زمینه کد نویسی خواستید (هر چند که خود استادید، صرفا از نظر محدودیت زمان گفتم) با کمال میل در خدمتم 🙂

  6. فهیمه گفته:

    سلام سایت خوبی بود ممنونم. موفق باشید.از دوستم لیلا ممنونم که این سایت را بهم معرفی کرد.

  7. بهزاد گفته:

    هر چند علاقه ای به شعر و ادبیات ندارم ولی هر روز چند دقیقه وقت میزارم چون فکر می کنم این کار برای خیلی ها ارزش زیادی داره.

  8. علیرضا گفته:

    با سلام و خسته نباشید.
    این کار بسیار عالی هست. موفق باشید.
    من هم سعی میکنم خودم کمک کنم و هم به دوستان خود بگم که به این کار بسسسسسسیار زیبا کمک کنند.

  9. حسین گفته:

    سلام واقعا عالیه دستتون درد نکنه از جواد داداش ممنونم که گنجور رو به من معرفی کرد.
    دردانه بسیار زیبائی هم گذاشتید
    نشد جان محرم اسرار جانان بر ان محروم نامحرم بگرییم

  10. علي مصدر گفته:

    دست مریزاد. باشد که کار شما کم از فردوسی و دهخدا نباشد. یقین دارم زحمات شما به زنده ماندن زبان پارسی و خالقان آن کمک خواهد کرد. شاد باشید.

  11. بهیار گفته:

    درود برشما عزیزان وتشکر بی نهایت از زحمات شما برای زنده نگاه داشتن زبان وادبیات فارسی ایران زمین سر زمین عزیزمان

  12. ط.ن. گفته:

    خدا قوت

  13. رضا سیادت گفته:

    اقدام بزرگ و پرارزشی است. موفق باشید

  14. شاعر دلسوخته كوير گفته:

    با سلام و خسته نباشید
    خواستم تشکر کنم به خاطر همتی که برای حفظ اثار من و امثال من به خرج می دهید
    واقعا ممنون و متشکر

  15. شاعر دلسوخته كوير گفته:

    البته یادم رفت بگم ایم پیام را از طرف حافظ و سعدی و… نیز گفته ام

  16. Anonymous گفته:

    بهتره تو تشخیص متنتون از دیکشنری هم استفاده کنید تا دقیقتر بشه نتایجش

  17. اصلان گفته:

    لطفا گزارش را به روز رسانی کنید ، خیلی قدیمی شده

  18. حمیدرضا گفته:

    @اصلان:
    یه گزارش جدیدتر اینجا هست:
    http://blog.ganjoor.net/1389/05/09/ocr-stats2
    ضمن این که مرحلهٔ اول کار تموم شده و به زودی بخشی از غزلیات بیدل و قصاید قاآنی در سایت در دسترس قرار می‌گیره و الان بخش باقیماندهٔ غزلیات بیدل برای بازبینی در دسترس گذاشته شده.

  19. حمیدرضا گفته:

    @ناشناس (پیشنهاد دیکشنری برای بهتر شدن نتایج):
    تا اونجا که من خبر دارم به صورت محدود و مشروطی نرم‌افزار OCR مورد استفاده همین کار رو می‌کنه.

  20. حامد خادمی گفته:

    درود بر شما
    بنده دبیر جوان ادبیات فارسی و نویسنده و شهعر هستم؛ عادت هم ندارم بی خودی از کسی تعریف کنم؛ ولی باید به شما عرض کنم که کارتون عالیه، واقعن غرورانگیزه، و حتمن حتمن حتمن ازتون می خوام که اگر کمکی از دست این حقیر برمیاد از طریق ایمیل به من خبر بدین، حسابی کیفور شدم از این سایت…
    ان شا الله خدا کیفورتون کنه…

  21. مجتبی گفته:

    سلام خسته نباشید بنده ضمن قدر دانی از زحمات شما در حد توان کمک خواهم کرد و بنظر من با تبلیغ و لینک در سایتهای دیگر میتوان به پیشرفت و سرعت کار کمک کرد .

  22. امید گفته:

    با درود خدمت سروران گرامی
    ضمن سپاس گذاری از تصمیم ارزشمند شما و خسته نباشید امیدوارم که دوستانی که در شبکه های اجتماعی فعال هستند با اشتراک گذاشتن این سایت (درگاه) و توضیحاتی مختصر درخصوص توانایی افراد در همکاری این پروژه ملی در به پایان رسیدن هر چه سریعتر آن نقش بیشتری را ایفا کنند.من از طریق لینکی از بالاترین که بدون توضیح بود وارد این سایت شدم و بسیار از این رخداد خشنود شدم.

    همه با هم برای اعتلای فرهنگ تلاش کنیم.
    من اگر بخیزم تو اگر برخیزی، همه برخیزند.

    پیروز و سربلند باشید

  23. مرتضی گفته:

    دوست گرامی
    از زحمتی که می کشید ممنونم
    بدونید که تو این کار تنها نیستید و خیلی هم با شما خواهند بود از جمله خود من.
    اما چند نکته ، اول این که من نمی دونم این کار دقیقا از کی شروع شده ولی اینو می دونم که اگه اتفاقی روی لینکی کلیک نکرده بودم هیچ وقت به اینجا نمی رسیدم . به نظر میاد تبلیغات کم و ضعیفه و با توجه به علاقه ای که دربین مردم به فرهنگ ایران هست اگه تبلیغ موثری بشه کار به سرعتی پیشرفت می کنه راهشو دیگه باید خودتون پیدا کنید .
    دوم هم این که به نظر من یکم توضیحی که دادید برای کمک سنگینه یکم ساده تر باشه تا اگه کسی هم زیاد اطلاع نداره و علاقه داره دل زده نشه و اینجا رو ترک نکنه .
    با آروزی موفقیت برای شما

  24. حمیدرضا گفته:

    @مرتضی:
    توضیح در مورد کمک؟ کدوم یکی صفحهٔ «کمک مالی» رو می‌گید یا «بازبینی خروجیهای OCR»؟ پیشنهاد شما چیه؟

  25. مهدي گفته:

    درود
    یاران رادیو گلها از دیروز ۷ دی ۱۳۸۹ آغاز یاری نموده اند.

نظرتان را بنویسید (نکتهٔ مهم: اگر برای نوشتن حاشیه در مورد شعرها اینجا آمده‌اید اشتباه آمده‌اید و باید در خود سایت گنجور حاشیه بگذارید. نظرات بی‌ربط به این نوشته پاک می‌شوند.)