تلفظ صحیح گنجور

هر از چند گاه دوستانی تماس می‌گیرند و متذکر می‌شوند که تلفظ «گنجور» نه ganjoor که ganjvar است و من در انتخاب نام دامنه اشتباه کرده‌ام. منشأ این قضیه گویا یک یا چند فرهنگ فارسی است که تلفظ این واژه را به این نحو ثبت کرده یا ارجاع به ریشهٔ این واژه است که آن را مرکب از «گنج» و «بر» می‌دانند و اعتقاد دارند اصل این واژه «گنجبَر» است و وقتی «ب» به «و» تبدیل می‌شود باید آن را گنجوَر بخوانیم. در هر صورت، برای ارجاع بعدی دوستان مطلبی را که چندباره در پاسخ به ایمیلهای دوستان نوشته‌ام اینجا دوباره مطرح می‌کنم:

اوّل آن که در نسخهٔ آنلاین لغتنامهٔ دهخدا هر دو تلفظ برای گنجور ثبت شده (تلفظ اول نشان دهندهٔ آن است که واو حرکت ندارد و باید کشیده خوانده شود):

گنجور در لغتنامه

راهنمای بعدی برای این که این واژه باید ganjoor تلفظ شود یا حداقل تلفظ این واژه به این صورت اشتباه نیست آن است که توجه کنیم دو تلفظ مورد بحث (ganjoor و ganjvar) هموزن نیستند، لذا اگر در شعر موزونی بتوان این واژه را ganjoor خواند دیگر نمی‌توان آن را ganjvar خواند زیرا وزن شعر به هم می‌ریزد و بالعکس. علاوه بر آن می‌توان به این نکته توجه کرد که شاعران کهن این واژه را در جایگاه قافیه با چه کلماتی همقافیه آورده‌اند.

با توجه به نکات یاد شده شاهدهای لغتنامه برای این کلمه را در این صفحه و کاربرد آن را در شعر شاعران گنجور بازخوانی کنید و سعی کنید یک مورد را بیابید که در آن بشود این واژه را ganjvar خواند و وزن شعر درست بماند و شعر موزون خوانده شود!

گنجور نه گنجور!
گنجور در جایگاه قافیه

گلستان سعدی در گنجور

از آنجا که عموماً تا به حال -جز معدود تکه‌هایی از بعضی کتابها- آثار منثور را در گنجور نداشتیم گلستان سعدی را به گنجور اضافه نکرده بودم و به جای آن در بخش سعدی پیوندی به متن این کتاب در سایت ویکی‌نسک گذاشته بودم.

یکی از دوستان -آقای مسعود دهقانی-، چند روز پیش اطلاع دادند که این پیوند دیگر کار نمی‌کند و ویکی‌نسک این اثر را حذف کرده.

به پیشنهاد این دوست عزیز، گلستان را با استفاده از آرشیو ویکی‌نسک به گنجور اضافه کردم.

تا آنجا که من بررسی کردم، نسخهٔ ویکی‌نسک ناقص است اما در هر حال از متن دستکاری شده و غیرقابل اعتماد ارائه شده در سایت تصوف ایرانی (اینجا) -که گویا بدون این که ذکر شده باشد برگردان امروزی قسمتهای منثور گلستان به انضمام اصل بیشتر شعرهاست- بهتر است.

امیدوارم با کمک دوستان گنجور، نقایص بخش گلستان سعدی در گنجور نیز به مرور زمان رفع شود.

گلستان سعدی را می‌توانید در این بخش از گنجور مطالعه کنید.

گزارشی از روند پیشرفت بازبینی خروجیهای OCR

در مرحلهٔ اول کار بازبینی چشمی خروجیهای OCR تعداد ۵۳۰۳۷ تکه تصویر متن بریده شده از جلد اول غزلیات بیدل و قصاید قاآنی در معرض بازبینی قرار گرفته که تا امروز با گذشت ۱۸ روز از فراخوان برای همکاری دوستداران ادبیات فارسی حدود ۴۷ درصد از این تصاویر (۲۴۸۵۲ تکه) حداقل یک بار بازبینی شده‌اند (۱۴ درصد از کل تصاویر بیش از یک بار بازبینی شده‌اند). آمار روزانهٔ بازبینیها از طریق این صفحه در دسترس قرار دارد.

تعداد ۲۳۰۷ آی.پی مجزا برای بازبینها به ثبت رسیده است. تصویر زیر نشانگر آمار ثبت شده برای بازدیدها از سیستم بازبینی توسط سیستم آمارگیری گوگل است:

آمار بازدیدهای از سیستم بازبینی خروجیهای OCR

جدول زیر آمار تفکیکی کشورهای بازدیدکننده‌ها را به ترتیب تعداد صفحات بازدید شده به ازای هر نفر نشان می‌دهد.

کشورهای بازدیدکنندگان

از همهٔ دوستانی که در این کار مشارکت کرده و می‌کنند تشکر می‌کنم. با روند فعلی به نظر می‌رسد تا در دسترس قرار گرفتن اولین خروجی این همکاری در سایت باید چیزی حدود یک ماه دیگر فاصله داشته باشیم. طبق برنامهٔ فعلی در مرحلهٔ دوم باقیماندهٔ غزلیات بیدل (جلد دوم) و دیوان قاآنی و احتمالاً در مرحلهٔ سوم دیوان کامل ملک‌الشعرای بهار برای بازبینی در دسترس قرار خواهند گرفت.

نکاتی دربارهٔ گنجور رومیزی

دوست عزیزی زحمت کشیده‌اند و در یک نوشتهٔ مفصل علاوه بر معرفی گنجور رومیزی نقاط ضعف و قوت آن را از نظر خودشان بررسی کرده‌اند. اگر علاقمند بودید نگاهی به این مطلب جامع بیندازید: اینجا.

سیستم بازبینی چشمی خروجیهای او.سی.آر

پیش‌تر اشاره کرده بودم که قصد دارم به کمک OCR دامنهٔ داده‌های موجود در گنجور را گسترش دهم و کار را هم با اضافه کردن کتاب کوچکی از سنایی غزنوی، قسمتی از غزلیات بیدل دهلوی و چند قصیده از قاآنی شروع کرده بودم.

قبلاً هم گفته بودم که اضافه کردن اشعار با استفاده از OCR، غیر از امکانات و زمانی که برای اسکن و اجرای پردازش OCR روی ورودیها و دریافت خروجی نیاز دارد نیاز به یک کار چشمی پر زحمت دارد تا دقت خروجیها به سطح قابل قبول برسد. گفته بودم که برنامه‌ای دارم برای آن که علاقمندان گنجور را در این کار به همیاری دعوت کنم و با استفاده از مشارکت آنها سرعت و دقت گسترش دامنهٔ داده‌ها افزایش یابد.

الان، طرح ساده‌ای آماده کرده‌ام برای آن که به کمک آن این امر را محقق کنم. علاقمندان با مراجعه به این نشانی می‌توانند با بازبینی خروجیهای OCR به گسترش دامنهٔ داده‌های گنجور کمک کنند. سیستم طراحی شده بر اساس تعداد رأیهای کاربران به متون کار می‌کند و نهایتاً با غربال پررأی‌ترین گزینه‌ها خروجیها را تولید خواهم کرد. اگر اشتباه کردید: اشتباه تایپی یا انتخاب اشتباه، نگران نباشید! علاقمندان دیگر نیز خروجیها را می‌بینند و اشتباه شما را با رأیهایشان به متون درست‌تر تصحیح می‌کنند. فقط لطفاً در صورتی که صفحه‌کلید فارسی ندارید در این کار مشارکت نکنید! ورود متون به صورت فارگلیسی هیچ کمکی نمی‌کند.

بازبینی چشمی خروجیهای OCR

فعلاً خروجیهای باقیماندهٔ جلد اول غزلیات بیدل دهلوی در این سیستم در دسترس قرار دارند و به زودی باقیماندهٔ دیوان قاآنی را نیز در این سیستم در معرض بازبینی علاقمندان قرار می‌دهم.

گنجور رومیزی در روزنامهٔ جام جم

روزنامهٔ جام جم در ضمیمهٔ روزهای یکشنبهٔ این هفتهٔ خود (کلیک) گنجور رومیزی را معرفی کرده (اینجا) و سایت گنجور را هم در ستون لینکدونی همین ضمیمه برای بازدید به خوانندگان خود پیشنهاد کرده است.

معرفی گنجور رومیزی در جام جم

پیشتر، تلویزیون فارسی BBC نیز در برنامهٔ «کلیک» گنجور را به بینندگان خود معرفی کرده بود.

[media id=1]

مشکلات سایت

به دنبال مشکلاتی که از بیست و پنجم اردیبهشت برای سایت گنجور پیش آمد (اینجا را ببینید)، شرکت ارائه دهندهٔ خدمات میزبانی پیشین، دسترسی به سایت را قطع کرد. پس از پیگیری، شرکت مزبور اعلام کرد که به علت فشاری که این سایت به سرورهایش می‌آورد دیگر نمی‌تواند به گنجور خدمات بدهد.

برای اطمینان از تهیهٔ یک سرویس میزبانی مطمئن تصمیم گرفتم به کمک یکی از دوستان ساکن خارج کشور خدمات میزبانی را از شرکت معتبر مدیاتمپل تهیه کنم. این امر دیروز محقق شد و اکنون سایت، پس از شش روز وقفه با استفاده از خدمات میزبانی این شرکت در دسترس قرار گرفته است.

از دوستانی که در این مدت، برای کمک در زمینهٔ میزبانی سایت تماس گرفتند تشکر می‌کنم.

از آنجا که بسیاری از محدودیتهای پیشین همچون محدودیت پهنای باند و فضا تا حدود زیادی با خرید سرویس میزبانی جدید رفع شده، تغییراتی در ساختار و نحوهٔ میزبانی منابع سایت داده خواهد شد. سعی می‌کنم روی بهینه‌سازی مصرف منابع سایت نیز کار کنم تا کمتر به مشکلاتی که میزبان قبلی ادعا داشت گنجور عامل آنهاست بر بخوریم.

گنجور رومیزی ویرایش ۱.۸۳

در سه خرده ویرایش ارائه شده بعد از ویرایش ۱.۸، علاوه بر چند رفع اشکال و بهبود در نمایشگر شعر، ویرایشگر شعر نیز صاحب قابلیتهای جدیدی شده است. فهرست کامل تغییرات را اینجا ببینید.

آثار شاملو در گنجور رومیزی ویرایش ۱.۸۳

آثار شاملو با استفاده از سایت shamlou.org و به کمک ویرایشگر داخلی برنامه به پایگاه داده‌های برنامه اضافه شده است. پس از به‌روزرسانی برنامه می‌توانید با دریافت این فایل، خارج کردن آن از حالت فشرده، سپس اجرای فرمان «اضافه کردن مجموعه اشعار جدید» از منوی «ابزارها»ی برنامه می‌توانید آثار این شاعر گرانقدر معاصر را در گنجور رومیزی در دسترس داشته باشید.

گنجور رومیزی ویرایش ۱.۸

در این ویرایش امکان درج تک‌مصرعهای اشعار نیمایی و همینطور مشاهدۀ صحیح آنها در محیط اصلی برنامه اضافه شده، امکانات جدیدی در ویرایشگر در دسترس قرار گرفته و عملکرد ویرایشگر بهبود یافته است (فهرست کامل‌تر تغییرات را در این صفحه ببینید).

پشتیبانی از نمایش و ویرایش اشعار آزاد و نیمایی در گنجور رومیزی ویرایش ۱.۸

برای آزمایش امکانات جدید ویرایشگر، اشعاری از نیمایوشیج را (تمامی آنچه تا به حال از طریق سایت آوای آزاد از نیما در دسترس قرار گرفته) به شیوۀ کپی/پیست و از طریق ویرایشگر خود برنامه به پایگاه داده‌های برنامه اضافه کردم (دوستانی که از ویرایشهای قدیمی‌تر برنامه استفاده می‌کنند پس از دریافت و نصب به‌روزرسانی برنامه با دریافت این فایل، خارج کردن آن از حالت فشرده، سپس اجرای فرمان «اضافه کردن مجموعه اشعار جدید» از منوی «ابزارها»ی برنامه می‌توانند آثار نیما را از طریق گنجور رومیزی در دسترس داشته باشند).

چند قصیده از قاآنی

از مجموعه دیوانهایی که با تکیه بر کمک یکی از دوستان خریداری شده بود یکی هم دیوان قاآنی بود که اخیراً بخش قصاید آن را اسکن و OCR کرده‌ام. چند قصیدهٔ ابتدایی آن را بازبینی کرده‌ام و در گنجور در دسترس قرار گرفته‌اند.

دیوان قاآنی انتشارات نگاه

همانند آنچه در مورد آثار بیدل گفته شد، علی‌رغم آن که خروجی OCR این دو مجموعه رضایت‌بخش است، باز هم این خروجیها نیاز به بازبینی و تصحیح دارند. اعمال این تصحیحات پیش از قرار گرفتنشان در گنجور آسان‌تر است و امیدوارم به زودی راهکاری برای استفاده از کمک علاقمندان در تصحیح این آثار فراهم کنم؛ علی رغم آن که یکی از محدودیتهای عمده، لزوم وجود فضا و پهنای باند کافی برای در دسترس قرار دادن بریده‌های اصل تصاویر OCR شده است.