آماری از شعرهای گنجور

در حال حاضر گنجور مجموعاً دربردارنده‌ی ۳۳۴۴۵۱ بیت شعر از ۳۵ شاعر است که در قالب ۲۶۱۴۳ تکه تقسیم‌بندی شده‌اند. ۳۵ شاعر شامل ۳۴ شاعری است که نام آنها در صفحه‌ی اول آمده به همراه دقیقی طوسی که قسمتهایی از شاهنامه سروده‌ی اوست. در شمارش بیتها، تک‌مصرعهای تعویض بند در قالبهایی مانند مخمس و مانند آن یک بیت در نظر گرفته شده‌اند.

جدول زیر نشان دهنده‌ی آمار شعرها به تفکیک نام شاعر است:

آمار شعرهای گنجور به تفکیک نام شاعر

تا به حال ۳۲۸۴۸۹ بیت (۹۸ درصد) از اشعار گنجور وزنیابی شده‌اند. مجموعاً ۱۰۲ وزن در این اشعار تشخیص داده شده است. جدول زیر نمایانگر نحوه‌ی توزیع اوزان متداول‌تر در اشعار وزنیابی شده است:

آمار شعرهای گنجور به تفکیک وزن

ابوسعیدی که در بخارا زندگی می‏کرد و مدح می‏گفت!

تکبیتهای صائب، مفردات سعدی در مواعظ و ابیات پراکنده‌ی ابوسعید ابوالخیر را مجدداً سازماندهی کردم و فهرستهای الفبایی بر اساس حرف روی برایشان درست کردم. در مورد ابیات پراکنده‌ی منتسب به ابوسعید به نظرم رسید بسیاری از این اشعار، بیشتر منتسب به رودکی هستند تا ابوسعید (به عنوان نمونه این بیت را ببینید). به منبع اولیه (ری‌را) و همچنین نرم‌افزار درج ۷۸ (که با ری‌را تطابق کامل دارد) مراجعه کردم و این ابیات در هر دوی این منابع به نام ابوسعید ابوالخیر آورده شده‌اند. در هر صورت فکر می‌کنم در این مورد اشتباهی رخ داده است، هر چند سایر اشعار ابوسعید (رباعیاتش)، نیز اکثراً به شاعران دیگر منتسبند.

سعی کرده‌ام اشعاری را که در دل اشعار دیگر آورده شده‌اند پیدا کنم و جدایشان کنم. در هر صورت، از کاربران محترم سایت خواهشمندم هر جا چند شعر مستقل را در قالب یک شعر دیدند گزارش کنند تا مشکل رفع شود.

«مفتعلن مفتعلن مفتعلن» کشت مرا!

کمتر از دو ماه پیش وزنیابی شعرها را شروع کردم و تا امروز قریب به اتفاق شعرهای موجود در گنجور وزن‌گذاری شده‌اند. شعرهای عربی و بخشهایی که نیاز به سرکشی و مرتب‌سازی دارند (مثل تک‌بیتهای سعدی، صائب و تکه غزلهای امیرخسرو) وزنیابی نشده‌اند.

در هر صورت در فرصت مناسب سعی می‌کنم آماری از وزنهای به کار گرفته شده در گنجور دربیاورم، احتمالاً برای هر وزن صفحه‌ای مختص خودش بسازم و … .

دو تن از دوستان پای دو مطلب پیشین درباره‌ی وزن‌گذاری گنجور، نشانی سایتی به نام وبگاه آزمایشی عروض را داده‌اند که یک کار دانشجویی عالی در زمینه‌ی وزنیابی خودکار است. دوستانی که علاقمند هستند، به این سایت سر بزنند (اینجا).

شعرهای مشابه

خوب! پروژه‌ی وزنیابی شعرها (علی رغم مسافرت چند روزه‌ی من) تا حدودی خوب پیش رفته است و علاوه بر اشعار حافظ، اکنون تمام اشعار سعدی و هزار و دویست تا از غزلیات شمس، گزیده‌ی غزلیات شهریار، قسمتی از غزلیات خواجو و مجموعه‌هایی از رباعیات، دوبیتیها و مثنویات بلند شاعران مختلف را پوشش می‌دهد.

علاوه بر آن، برنامه‌ای برای پیدا کردن حروف روی و قافیه‌ی اشعار آماده کردم و آن را روی اشعار برخی از شاعران نامبرده اعمال کردم. هر چند در قافیه‌یابی به شیوه‌ی خودکار موانعی همچون رسم‌الخطهای متفاوت، سلیقه‌های متفاوت تایپیستها در فاصله‌گذاری بین کلمات و حذف یا عدم حذف بعضی حروف (مثل الف «است» و …)، غلطهای املایی و استثنائات قافیه باعث می‌شوند نتوان به شکل دلخواه اشعار را قافیه‌یابی کرد ولی نتایج اولیه به نظر من چندان بد نیست، خصوصاً با توجه به این که قافیه‌یابی مجموعه‌ی بزرگی از شعرها در زمانی در حد چند دقیقه انجام می‌شود.

در هر صورت، با استفاده از ترکیب این دو ویژگی (وزن و قافیه) قابلیت جدیدی به گنجور اضافه شده که با کلیک بر روی پیوند «شعرهای مشابه» در کادر حاشیه‌ها در دسترس قرار می‌گیرد. کلیک بر روی این پیوند، شما را به صفحه‌ای می‌برد که در آن اشعاری که هم وزن و هم قافیه‌ی آن با شعر مورد نظر شما یکسان است فهرست شده‌اند.

به این ترتیب می‌شود شعرهایی را که شاعران در استقبال از شاعران قدیمی‌تر خود سروده‌اند با خرج یک کلیک پیدا کرد. ضمن آن که علاوه بر «جستجو»، «استفاده از فهرستهای الفبایی» و «استفاده از پیوندهای شعر بعدی و شعر قبلی»، راهکار جدید و هوشمندتری هم برای گنجورگردی در اختیار علاقمندان قرار می‌گیرد.

برای مشاهده‌ی نحوه‌ی عملکرد قابلیت «شعرهای مشابه» روی پیوند متناظر با این قابلیت در این نمونه اشعار کلیک کنید: غزل دل می‌رود ز دستم (حافظ)، علی ای همای رحمت (شهریار)، غزل مطلب طاعت و … (حافظ) و مانند آن.

شعرهای مشابه

دامنه‌ی این قابلیت محدود به شعرهایی است که وزن‌گذاری و قافیه‌یابی شده‌اند و این به این معناست که دامنه‌ی عملکرد آن به مرور وسیع‌تر خواهد شد.

وزن اشعار و تصحیحات اخیر

در بسیاری از بخشها، مشکلاتی از قبیل آورده شدن دو یا چند شعر متفاوت در قالب یک شعر دیده می‌شد که در این چند وقت تا حدود زیادی رفع شده‌اند. با توجه به آن که سعی بر این بوده که تصحیحات اعمال شده و همچنین حاشیه‌های گذاشته شده از دست نروند و تصحیح اشکالات اشاره شده مستلزم حذف و ورود دوباره‌ی اشعار از منبع اولیه بود، این کار وقت زیادی گرفت.

در صورتی که وزن و قافیه‌ی اشعار تعیین شده باشد یافتن اشعار مشابه شاعران مختلف راحت می‌شود و به این طریق می‌توان به آسانی اشعاری را که شاعران در استقبال از هم گفته‌اند پیدا کرد. در دسترس بودن این دو مشخصه کارکردهای دیگری هم احتمالاً دارد. قافیه‌ی اشعار را می‌توان با یک برنامه‌ی کامپیوتری ساده به آسانی پیدا کرد، اما راهکار در دسترس برای پیدا کردن وزن -فعلاً- پیدا کردن دستی وزن اشعار است. در هر صورت، از دو روز پیش وزنیابی اشعار را آغاز کرده‌ام و فعلاً کل اشعار حافظ و اشعار ابتدایی غزلیات سعدی و غزلیات دیوان شمس وزنیابی شده‌اند که می‌توانید مشخصه‌ی وزن هر شعر را در کادر حاشیه‌های مخصوص به آن ببینید.

قابلیت نمایش وزن اشعار

گنج را به گنجور بسپارید!

جایی، در توضیح پیوندی که به سایت گنجور داده شده بود آمده بود که «گنجور مجموعه‌ی تقریباً کاملی از شعرهای فارسی است». این توصیف مسلماً درست نیست. به نظر شما گنجور پوشش دهنده‌ی چند درصد از ادبیات منظوم ایران است؟ عنصری، امیرمعزی، ابن‌یمین، کمال‌الدین اصفهانی، بیدل دهلوی، کلیم کاشانی، قاآنی و …! تا دلتان بخواهد می‌توان از شاعران بزرگی نام برد که حتی یک شعر کوچک از آنها در گنجور نیست. تازه به آنچه که هست -اگر نگاه کنید- بخش بزرگی از آثاری که در گنجور آمده گزیده‌های ناکامل و پرغلط از آثار شاعران است (غزلیات امیرخسرو دهلوی را محض نمونه ببینید). علت این امر هم مشخص است: تبدیل متن چاپی به متن قابل استفاده در سایتها و نرم‌افزارهای کامپیوتری نیازمند صرف وقت، هزینه و نیروی انسانی است و در مدلهای غیرتجاری و ناسودده فراهم آوردن چنین امکاناتی ممکن نیست. در نتیجه، گنجور و بسیاری از سایتهای مشابهی که این آثار را در دسترس قرار داده‌اند همگی صرفاً متکی به یک پایگاه‌داده‌های آزاد، محدود از لحاظ حجم و نسبتاً پرغلط بوده و هستند (یا احیاناً متکی هستند به پایگاه‌داده‌های نرم‌افزار درج ۷۸ از شرکت مهرارقام که از لحاظ متن –منهای دسته‌ای از غلطهای ایجاد شده توسط مشکلات سکوهای نرم‌افزاری– متن آن با ری‌را مشابهت کامل دارد).

چاره چیست؟! چرا نباید ادبیات منظوم و منثور ما، ارثیه‌ی ارزشمند ما در دسترس ما باشد؟ با توجه به عدم وجود یک مدل سودده و در عین حال آزاد برای انجام این کار، با توجه به هزینه‌های این کار چه می‌شود کرد؟

من فکری دارم. کسانی که نوشته‌های من را از طریق وبلاگ شخصیم دنبال می‌کنند این روزها مکرر راجع محصول او.سی.آر فارسی آراکس شنیده‌اند (اینجا، اینجا و اینجا را ببینید). من یک نسخه از این محصول را در اختیار دارم، به تواناییهای آن اعتقاد دارم و تصور می‌کنم این محصول می‌تواند در این زمینه کمک زیادی بکند. از لحاظ ابزارهای سخت‌افزاری کافی است اسکنری تهیه کنم و شروع به تبدیل آثار چاپی به متنهای قابل درج در گنجور کنم، این سهمی است که من می‌توانم در این کار به عهده داشته باشم: صرف وقت برای اسکن کردن آثار چاپی و درج آنها در گنجور. در حجمهای کوچک می‌توانم کار بازبینی و تصحیح غلطها را هم انجام دهم. اما ترجیح می‌دهم در صورتی که حجم ورودیها بالا باشد فکری برای شرکت دادن علاقمندان دیگر در تصحیح غلطها به صورت آنلاین به کمک تصویر نسخه‌های چاپی بکنم.

او.سی.آر شعر شهریار با آراکس

اما سهم شما: شما می‌توانید ورودیهای آن کار را تهیه کنید. اگر نسخه‌هایی از آثار شاعران فارسی‌گو را در اختیار دارید که حالت چاپی دارند (خطی نیستند، با خط نستعلیق هم نوشته نشده‌اند) و به آنها نیاز ندارید آنها را برای من بفرستید (با توجه به آن که من برای اسکن سریع این آثار نیاز دارم آنها را از هم باز کنم امیدی به برگشت آنها نداشته باشید! حتی اگر بازشان نکنم یا شرایط آنها مناسب تبدیل نباشد آنها را به عنوان هدیه از طرف شما برای خودم برمی‌دارم 😉 ). یا اگر اسکنر دارید و نمی‌خواهید اصل کتاب را از دست بدهید صفحات آن را اسکن کنید و برای من بفرستید، اگر خواستید به این شیوه عمل کنید حتماً قبل از شروع کار از طریق این صفحه با من تماس بگیرید تا در مورد حداقل دقت مورد نیاز و کیفیت اسکن راهنماییتان کنم. اگر هم آثاری را که در گنجور موجود نیست به صورت فایل متنی (و نه نرم‌افزار) در اختیار دارید آن را برای من ارسال کنید. برای اطلاع از نحوه‌ی ارسال فایل یا بسته‌ی فیزیکی کتابها از طریق این صفحه با من تماس بگیرید (در انتخاب آثار دقت کنید که آثار شاعران معاصر که تبدیل آنها به متن از مصادیق نقض حقوق مؤلفین است مناسب این کار نیستند، گزیده‌ها و گلچینها هم چندان به کار ما نمی‌آیند).

در صورت استقبال از این پیشنهاد صفحه‌ای برای ذکر نام و تشکر از کسانی که به این شیوه گنجور را یاری داده‌اند ایجاد خواهم کرد. منتظر تماس شما هستم!

تصحیحات گنجور

طی چند وقت اخیر چینش شعرهای ترکیبی (ترجیع بندها، ترکیب بندها و مانند آن) تصحیح شد. دوستان اگر شعری دیدند که ترکیبی است و ابیات آن به هم ریخته است اطلاع دهند. غزلیات و قصاید محتشم کاشانی که از لحاظ ترتیب مشکل داشتند نیز از نو مرتب شدند و فهرستهای الفبایی متناسب با آنها نیز تهیه شد.

مشکلات سایت

در طی چند روز اخیر امکان ارسال حاشیه وجود نداشت. علت این قضیه تلاش ناموفق من برای ارتقای نرم‌افزار مدیریت سایت بود که بعد از بازگشت به ویرایش قدیمی‌تر، برخی تغییرات روی ویرایش قدیمی اعمال نشده بود. متأسفانه گرفتاریهای شخصی این روزهای من مانع آن شد که متوجه مشکل شوم و مشکل لاینحل ماند تا این که امروز مشکل را دیدم و حل کردم. مدتها در نظر داشته‌ام یک تالار گفتگو برای طرح و حل این طور مشکلات راه‌اندازی کنم که وسواس و تعلق خاطر به رابطهای کاربری کاملاً بومی و مطابق استانداردهای طراحی وب تا به حال مانع انجام این کار شده.

دوستان علاقمند به فلیکر بد نیست سری به این گروه بزنند و عضو شوند یا نظراتشان را ارائه دهند. در مورد این گروه برنامه‌هایی دارم که اگر فرصت پیدا کنم عملیشان می‌کنم. اینجا را هم ببینید بد نیست.

در قسمت پایین هر شعر، تبلیغی راجع به یک نرم‌افزار تشخیص متن فارسی گذاشته‌ام (تولید شده در شرکتی که در آن کار می‌کنم، بابت این تبلیغ هم اضافه حقوق نگرفته‌ام 😉 و از روی علاقه به این نرم‌افزار و شرکت محل کارم این کار را انجام داده‌ام). دوست دارم بدانم نظرتان راجع به این کار من چیست؟ با توجه به این که گنجور قرار نیست متعلق به یک شخص یا شرکت باشد آیا من کار درستی کرده‌ام؟ آیا با توجه به این که تمام هزینه‌های گنجور را شخصاً و از جیب خودم پرداخت کرده‌ام، حق دارم چنین کاری بکنم یا نه؟ رک باشید لطفاً!

تصحیحات و تغییرات

۱) مشکل بزرگی از ری‌را به گنجور سرایت کرده بود و آن جا افتادن حرف «ؤ» و با شدت کمتری حرف «ئ» در بسیاری از اشعار بود که در حاشیه‌های تعداد زیادی از دوستان به آن اشاره شده بود (+، +، + و …). خوشبختانه نقل متن اشعار در نرم‌افزار درج ۷۸ با نقل ری‌را همخوانی دارد با این تفاوت که اشکال مزبور در آن مشاهده نمی‌شود. از این رو با یک مقابله‌ی ماشینی با پایگاه داده‌های این نرم‌افزار حدود ۱۳۰۰ مورد از اشکالات اینچنینی یافته و رفع شد.

۲) گزیده‌ی غزلیات شهریار با استفاده از پایگاه داده‌های نرم‌افزار درج به گنجور اضافه شد.

۳) با اشارات دوستان (+ و +) متوجه اشکالات عمده‌ای در نحوه‌ی سازماندهی گزیده‌ی غزلیات امیرخسرو دهلوی شدم. مشکل در اینجا بود که این گزیده در واقع خیلی جاها دستچین ابیاتی از هر غزل بوده و برای همین زیاد دیده می‌شد که پاره‌های ناهمگون غزلهای مختلف در قالب یک غزل آورده شده‌اند. این بخش سازماندهی مجدد شد و یک فهرست الفبایی نیز برای آن ایجاد شد.

۴) مثنویها و ابیات پراکنده‌ی به جا مانده از رودکی که در سازماندهی اشعار رودکی موقتاً حذف شده بودند با سازماندهی جدید بازگردانده شدند (البته بدون تصحیح دستی).

شماره‌گذاری ابیات

از این به بعد، با استفاده از امکان «شماره‌گذاری ابیات» که از طریق کادر حاشیه‌ها در دسترس قرار گرفته، می‌توانید شماره‌ی ابیات را ببینید که برای اعلام غلطهای املایی و مانند آن کارایی دارد. این قابلیت در مرورگرهای فایرفاکس ویرایش ۲، اپرا ویرایش ۹ و اینترنت اکسپلورر ویرایش ۷ آزمایش شده و کار می‌کند. در صورتی که با مرورگرهای جدید دیگر آزمایش کردید و کار نکرد لطفاً نام و ویرایش مرورگر خود را در نظرات همین نوشته اعلام کنید. البته این قابلیت در مورد ترکیب بندها و ترجیع‌بندهایی که مصاریع آنها به درستی چیده شده درست کار نمی‌کند که در آینده در مورد آنها هم تدبیری اندیشیده خواهد شد.

شماره‌گذاری ابیات

اواخر هفته‌ی گذشته گنجور در آستانه‌ی عبور از سقف پهنای باند بود که برای جلوگیری از رخداد فروردین ماه پهنای باند بیشتری برای آن خریداری شد (ضمن تشکر از دوستانی که قول کمک در این زمینه را داده‌اند).

بعدنوشت: مسئله‌ی شماره‌گذاری ابیات برای ترجیع بندها و ترکیب بندها هم حل شد.