بایگانی سالیانه: ۱۳۸۷

استقبالهای حافظ از سعدی و تغییرات دیگر

چند وقت پیش در کتابی فهرست چند غزل از حافظ را دیدم که در آنها حافظ مستقیماً ابیاتی از سعدی (یا دقیقاً خاطرم نیست شاید دیگر شاعران) را نقل قول کرده بود. به نظرم رسید که بد نیست برنامه‌ی کوچکی برای مقایسه‌ی مصرع به مصرع اشعار شاعران مختلف بنویسم و این موارد را استخراج کنم. در هر صورت به کمک برچسبها بعضی از خروجیهای آن برنامه را علامت زده‌ام. به عنوان نمونه برچسب سعدی یا خواجوی کرمانی را ببینید. در هر صورت این خروجیها نیاز به سازماندهی بهتری دارند و چون این کار در حال حاضر باید به صورت دستی صورت گیرد زمان زیادی می‌برد. به عنوان اولین خروجی سازماندهی شده و مرتب این کار می‌توانید صفحه‌ی استقبالهای حافظ از سعدی را ببینید که به مدد تعطیلی امروز آماده‌اش کردم.

استقبالهای حافظ از سعدی

مدتی پیش با توجه به این غزلیات شهریار را از منبعی غیر از ری‌را به سایت اضافه کرده بودم (درج ۷۸) و امیدوار بودم (و هستم) که به کمک منابع دیگر بتوانیم دامنه‌ی پوشش آثار سخنسرایان پارسی‌گو را در گنجور گسترش دهیم در کادر حاشیه‌ها عنوان «منبع اولیه» را اضافه کردم و پیوند به سایت ری‌را را در قسمت پایینی صفحات، با پیوند به صفحه‌ی منابع جایگزین کردم.

منبع اولیه

چند وقت پیش، ایمیلی از یکی از دوستان دریافت کردم که در آن درخواست شده بود پیوند به شعرهای بعدی و قبلی پایین شعرها گذاشته شود. این پیوند پیش از این وجود داشته، اما جای آن زیر کادر «حاشیه‌ها» بوده، به همین دلیل فکر کردم که بهتر است جای پیوند به شعر قبلی و بعدی را بالای کادر حاشیه‌ها بگذارم تا دسترسی به آن آسان‌تر باشد و بیشتر در معرض دید باشد.

پیش‌تر کسانی که مشترک خوراک وبلاگ شخصی من بودند، «تازه‌های گنجور» را هم به صورت مخلوط با نوشته‌های وبلاگ من دریافت می‌کردند. همچنان که اینجا اشاره کرده‌ام تصمیم گرفتم این دو را از هم جدا کنم. لذا در صورتی که مایل به دنبال کردن تازه‌های گنجور از طریق خوراک هستید مشترک خوراک مستقل آن شوید.

امکان نمایش شعر تصادفی در وبلاگها با استفاده از گنجور

در پی پیشنهاد دوست گرامی نویسنده‌ی وبلاگ گناهکار، امکان نمایش یک تک‌بیت یا رباعی تصادفی از گنجور توسط یک تکه کد قابل بدلخواهسازی فراهم شده. نمونه‌هایی از بلوکهای قابل نمایش توسط این کد را مشاهده می‌کنید:

کدهای گنجور
کدهای گنجور
کدهای گنجور
کدهای گنجور
کدهای گنجور

برای اطلاع از نحوه‌ی عملکرد و روش درج این کد این صفحه را ببینید.

شعرها را برچسب بزنید

تا به حال پیش آمده که بخواهید اشعار را به صورت موضوعی پیدا کنید؟ مثلاً بخواهید شعرهایی را پیدا کنید که موضوع آنها «وصف بهار» یا «وصف پاییز» است و یا «انتقادی» هستند و یا مضمون آنها «پند اخلاقی» یا «پند دینی» است؟ تا به حال پیش آمده که بخواهید شعرهایی را پیدا کنید که «دوزبانه» هستند، یا «دووزنی» هستند یا «بیتهای عربی» دارند یا «بیتهای ترکی» دارند یا …؟ تا به حال پیش آمده که بخواهید شعرهای «مشکوک» منتسب به حافظ را از شعرهایی که مسلماً از آن حافظ هستند تشخیص دهید؟

برچسبها راه حال مناسبی برای تعیین فراداده‌هایی مانند این هستند. اطلاعاتی راجع به شعرها که در متن شعر راجع به آن به طور مستقیم سخنی نیامده. این فرداده‌ها می‌توانند به طبقه‌بندی بهتر شعرها کمک کنند.

از امروز، به کمک عنوان «برچسبها» در پایین کادر حاشیه‌ها می‌توانید برای شعرها برچسب تعیین کنید. این کار در صورتی که به مرور زمان و توسط کاربران مختلف انجام شود می‌تواند به طبقه‎بندی بهتر شعرها کمک کند. در اضافه کردن برچسب، توجه داشته باشید که کلمات عمومی و کلی مانند «جان»، «فلک» و مانند آن که اطلاعات ارزشمندی ندارند و در واقع جزئی از متن شعرها هستند چندان کمکی به دستیابی به هدف شرح داده شده نمی‌کنند. سعی کنید موضوعات شعرها را تعیین کنید (مدح، هجو، هزل، داستان، مرثیه، وصف، ماده تاریخ، تاریخی، وصف طبیعت، وصف حال، پند، مذهبی، انتقادی و مانند آن)، ویژگیهای خاص شعرها را تعیین کنید (دووزنی، دوقافیه، دوزبانه، ابیات عربی، ابیات ترکی، مشکوک، منتسب به شاعر دیگر، …) و در کل اطلاعاتی را اضافه کنید که به طبقه‌بندی بهتر شعرها کمک می‌کنند.

شعرها را برچسب بزنید

مجموعه‌ی برچسبهای اضافه شده تا به حال را می‌توانید از طریق صفحه‌ی برچسبها (که از طریق پیوندهای پایین صفحات در دسترس قرار دارد) ببینید.

پیوند به صفحه‌ی برچسبها

آماری از شعرهای گنجور

در حال حاضر گنجور مجموعاً دربردارنده‌ی ۳۳۴۴۵۱ بیت شعر از ۳۵ شاعر است که در قالب ۲۶۱۴۳ تکه تقسیم‌بندی شده‌اند. ۳۵ شاعر شامل ۳۴ شاعری است که نام آنها در صفحه‌ی اول آمده به همراه دقیقی طوسی که قسمتهایی از شاهنامه سروده‌ی اوست. در شمارش بیتها، تک‌مصرعهای تعویض بند در قالبهایی مانند مخمس و مانند آن یک بیت در نظر گرفته شده‌اند.

جدول زیر نشان دهنده‌ی آمار شعرها به تفکیک نام شاعر است:

آمار شعرهای گنجور به تفکیک نام شاعر

تا به حال ۳۲۸۴۸۹ بیت (۹۸ درصد) از اشعار گنجور وزنیابی شده‌اند. مجموعاً ۱۰۲ وزن در این اشعار تشخیص داده شده است. جدول زیر نمایانگر نحوه‌ی توزیع اوزان متداول‌تر در اشعار وزنیابی شده است:

آمار شعرهای گنجور به تفکیک وزن

ابوسعیدی که در بخارا زندگی می‏کرد و مدح می‏گفت!

تکبیتهای صائب، مفردات سعدی در مواعظ و ابیات پراکنده‌ی ابوسعید ابوالخیر را مجدداً سازماندهی کردم و فهرستهای الفبایی بر اساس حرف روی برایشان درست کردم. در مورد ابیات پراکنده‌ی منتسب به ابوسعید به نظرم رسید بسیاری از این اشعار، بیشتر منتسب به رودکی هستند تا ابوسعید (به عنوان نمونه این بیت را ببینید). به منبع اولیه (ری‌را) و همچنین نرم‌افزار درج ۷۸ (که با ری‌را تطابق کامل دارد) مراجعه کردم و این ابیات در هر دوی این منابع به نام ابوسعید ابوالخیر آورده شده‌اند. در هر صورت فکر می‌کنم در این مورد اشتباهی رخ داده است، هر چند سایر اشعار ابوسعید (رباعیاتش)، نیز اکثراً به شاعران دیگر منتسبند.

سعی کرده‌ام اشعاری را که در دل اشعار دیگر آورده شده‌اند پیدا کنم و جدایشان کنم. در هر صورت، از کاربران محترم سایت خواهشمندم هر جا چند شعر مستقل را در قالب یک شعر دیدند گزارش کنند تا مشکل رفع شود.

«مفتعلن مفتعلن مفتعلن» کشت مرا!

کمتر از دو ماه پیش وزنیابی شعرها را شروع کردم و تا امروز قریب به اتفاق شعرهای موجود در گنجور وزن‌گذاری شده‌اند. شعرهای عربی و بخشهایی که نیاز به سرکشی و مرتب‌سازی دارند (مثل تک‌بیتهای سعدی، صائب و تکه غزلهای امیرخسرو) وزنیابی نشده‌اند.

در هر صورت در فرصت مناسب سعی می‌کنم آماری از وزنهای به کار گرفته شده در گنجور دربیاورم، احتمالاً برای هر وزن صفحه‌ای مختص خودش بسازم و … .

دو تن از دوستان پای دو مطلب پیشین درباره‌ی وزن‌گذاری گنجور، نشانی سایتی به نام وبگاه آزمایشی عروض را داده‌اند که یک کار دانشجویی عالی در زمینه‌ی وزنیابی خودکار است. دوستانی که علاقمند هستند، به این سایت سر بزنند (اینجا).

شعرهای مشابه

خوب! پروژه‌ی وزنیابی شعرها (علی رغم مسافرت چند روزه‌ی من) تا حدودی خوب پیش رفته است و علاوه بر اشعار حافظ، اکنون تمام اشعار سعدی و هزار و دویست تا از غزلیات شمس، گزیده‌ی غزلیات شهریار، قسمتی از غزلیات خواجو و مجموعه‌هایی از رباعیات، دوبیتیها و مثنویات بلند شاعران مختلف را پوشش می‌دهد.

علاوه بر آن، برنامه‌ای برای پیدا کردن حروف روی و قافیه‌ی اشعار آماده کردم و آن را روی اشعار برخی از شاعران نامبرده اعمال کردم. هر چند در قافیه‌یابی به شیوه‌ی خودکار موانعی همچون رسم‌الخطهای متفاوت، سلیقه‌های متفاوت تایپیستها در فاصله‌گذاری بین کلمات و حذف یا عدم حذف بعضی حروف (مثل الف «است» و …)، غلطهای املایی و استثنائات قافیه باعث می‌شوند نتوان به شکل دلخواه اشعار را قافیه‌یابی کرد ولی نتایج اولیه به نظر من چندان بد نیست، خصوصاً با توجه به این که قافیه‌یابی مجموعه‌ی بزرگی از شعرها در زمانی در حد چند دقیقه انجام می‌شود.

در هر صورت، با استفاده از ترکیب این دو ویژگی (وزن و قافیه) قابلیت جدیدی به گنجور اضافه شده که با کلیک بر روی پیوند «شعرهای مشابه» در کادر حاشیه‌ها در دسترس قرار می‌گیرد. کلیک بر روی این پیوند، شما را به صفحه‌ای می‌برد که در آن اشعاری که هم وزن و هم قافیه‌ی آن با شعر مورد نظر شما یکسان است فهرست شده‌اند.

به این ترتیب می‌شود شعرهایی را که شاعران در استقبال از شاعران قدیمی‌تر خود سروده‌اند با خرج یک کلیک پیدا کرد. ضمن آن که علاوه بر «جستجو»، «استفاده از فهرستهای الفبایی» و «استفاده از پیوندهای شعر بعدی و شعر قبلی»، راهکار جدید و هوشمندتری هم برای گنجورگردی در اختیار علاقمندان قرار می‌گیرد.

برای مشاهده‌ی نحوه‌ی عملکرد قابلیت «شعرهای مشابه» روی پیوند متناظر با این قابلیت در این نمونه اشعار کلیک کنید: غزل دل می‌رود ز دستم (حافظ)، علی ای همای رحمت (شهریار)، غزل مطلب طاعت و … (حافظ) و مانند آن.

شعرهای مشابه

دامنه‌ی این قابلیت محدود به شعرهایی است که وزن‌گذاری و قافیه‌یابی شده‌اند و این به این معناست که دامنه‌ی عملکرد آن به مرور وسیع‌تر خواهد شد.

وزن اشعار و تصحیحات اخیر

در بسیاری از بخشها، مشکلاتی از قبیل آورده شدن دو یا چند شعر متفاوت در قالب یک شعر دیده می‌شد که در این چند وقت تا حدود زیادی رفع شده‌اند. با توجه به آن که سعی بر این بوده که تصحیحات اعمال شده و همچنین حاشیه‌های گذاشته شده از دست نروند و تصحیح اشکالات اشاره شده مستلزم حذف و ورود دوباره‌ی اشعار از منبع اولیه بود، این کار وقت زیادی گرفت.

در صورتی که وزن و قافیه‌ی اشعار تعیین شده باشد یافتن اشعار مشابه شاعران مختلف راحت می‌شود و به این طریق می‌توان به آسانی اشعاری را که شاعران در استقبال از هم گفته‌اند پیدا کرد. در دسترس بودن این دو مشخصه کارکردهای دیگری هم احتمالاً دارد. قافیه‌ی اشعار را می‌توان با یک برنامه‌ی کامپیوتری ساده به آسانی پیدا کرد، اما راهکار در دسترس برای پیدا کردن وزن -فعلاً- پیدا کردن دستی وزن اشعار است. در هر صورت، از دو روز پیش وزنیابی اشعار را آغاز کرده‌ام و فعلاً کل اشعار حافظ و اشعار ابتدایی غزلیات سعدی و غزلیات دیوان شمس وزنیابی شده‌اند که می‌توانید مشخصه‌ی وزن هر شعر را در کادر حاشیه‌های مخصوص به آن ببینید.

قابلیت نمایش وزن اشعار

گنج را به گنجور بسپارید!

جایی، در توضیح پیوندی که به سایت گنجور داده شده بود آمده بود که «گنجور مجموعه‌ی تقریباً کاملی از شعرهای فارسی است». این توصیف مسلماً درست نیست. به نظر شما گنجور پوشش دهنده‌ی چند درصد از ادبیات منظوم ایران است؟ عنصری، امیرمعزی، ابن‌یمین، کمال‌الدین اصفهانی، بیدل دهلوی، کلیم کاشانی، قاآنی و …! تا دلتان بخواهد می‌توان از شاعران بزرگی نام برد که حتی یک شعر کوچک از آنها در گنجور نیست. تازه به آنچه که هست -اگر نگاه کنید- بخش بزرگی از آثاری که در گنجور آمده گزیده‌های ناکامل و پرغلط از آثار شاعران است (غزلیات امیرخسرو دهلوی را محض نمونه ببینید). علت این امر هم مشخص است: تبدیل متن چاپی به متن قابل استفاده در سایتها و نرم‌افزارهای کامپیوتری نیازمند صرف وقت، هزینه و نیروی انسانی است و در مدلهای غیرتجاری و ناسودده فراهم آوردن چنین امکاناتی ممکن نیست. در نتیجه، گنجور و بسیاری از سایتهای مشابهی که این آثار را در دسترس قرار داده‌اند همگی صرفاً متکی به یک پایگاه‌داده‌های آزاد، محدود از لحاظ حجم و نسبتاً پرغلط بوده و هستند (یا احیاناً متکی هستند به پایگاه‌داده‌های نرم‌افزار درج ۷۸ از شرکت مهرارقام که از لحاظ متن –منهای دسته‌ای از غلطهای ایجاد شده توسط مشکلات سکوهای نرم‌افزاری– متن آن با ری‌را مشابهت کامل دارد).

چاره چیست؟! چرا نباید ادبیات منظوم و منثور ما، ارثیه‌ی ارزشمند ما در دسترس ما باشد؟ با توجه به عدم وجود یک مدل سودده و در عین حال آزاد برای انجام این کار، با توجه به هزینه‌های این کار چه می‌شود کرد؟

من فکری دارم. کسانی که نوشته‌های من را از طریق وبلاگ شخصیم دنبال می‌کنند این روزها مکرر راجع محصول او.سی.آر فارسی آراکس شنیده‌اند (اینجا، اینجا و اینجا را ببینید). من یک نسخه از این محصول را در اختیار دارم، به تواناییهای آن اعتقاد دارم و تصور می‌کنم این محصول می‌تواند در این زمینه کمک زیادی بکند. از لحاظ ابزارهای سخت‌افزاری کافی است اسکنری تهیه کنم و شروع به تبدیل آثار چاپی به متنهای قابل درج در گنجور کنم، این سهمی است که من می‌توانم در این کار به عهده داشته باشم: صرف وقت برای اسکن کردن آثار چاپی و درج آنها در گنجور. در حجمهای کوچک می‌توانم کار بازبینی و تصحیح غلطها را هم انجام دهم. اما ترجیح می‌دهم در صورتی که حجم ورودیها بالا باشد فکری برای شرکت دادن علاقمندان دیگر در تصحیح غلطها به صورت آنلاین به کمک تصویر نسخه‌های چاپی بکنم.

او.سی.آر شعر شهریار با آراکس

اما سهم شما: شما می‌توانید ورودیهای آن کار را تهیه کنید. اگر نسخه‌هایی از آثار شاعران فارسی‌گو را در اختیار دارید که حالت چاپی دارند (خطی نیستند، با خط نستعلیق هم نوشته نشده‌اند) و به آنها نیاز ندارید آنها را برای من بفرستید (با توجه به آن که من برای اسکن سریع این آثار نیاز دارم آنها را از هم باز کنم امیدی به برگشت آنها نداشته باشید! حتی اگر بازشان نکنم یا شرایط آنها مناسب تبدیل نباشد آنها را به عنوان هدیه از طرف شما برای خودم برمی‌دارم 😉 ). یا اگر اسکنر دارید و نمی‌خواهید اصل کتاب را از دست بدهید صفحات آن را اسکن کنید و برای من بفرستید، اگر خواستید به این شیوه عمل کنید حتماً قبل از شروع کار از طریق این صفحه با من تماس بگیرید تا در مورد حداقل دقت مورد نیاز و کیفیت اسکن راهنماییتان کنم. اگر هم آثاری را که در گنجور موجود نیست به صورت فایل متنی (و نه نرم‌افزار) در اختیار دارید آن را برای من ارسال کنید. برای اطلاع از نحوه‌ی ارسال فایل یا بسته‌ی فیزیکی کتابها از طریق این صفحه با من تماس بگیرید (در انتخاب آثار دقت کنید که آثار شاعران معاصر که تبدیل آنها به متن از مصادیق نقض حقوق مؤلفین است مناسب این کار نیستند، گزیده‌ها و گلچینها هم چندان به کار ما نمی‌آیند).

در صورت استقبال از این پیشنهاد صفحه‌ای برای ذکر نام و تشکر از کسانی که به این شیوه گنجور را یاری داده‌اند ایجاد خواهم کرد. منتظر تماس شما هستم!

تصحیحات گنجور

طی چند وقت اخیر چینش شعرهای ترکیبی (ترجیع بندها، ترکیب بندها و مانند آن) تصحیح شد. دوستان اگر شعری دیدند که ترکیبی است و ابیات آن به هم ریخته است اطلاع دهند. غزلیات و قصاید محتشم کاشانی که از لحاظ ترتیب مشکل داشتند نیز از نو مرتب شدند و فهرستهای الفبایی متناسب با آنها نیز تهیه شد.