بایگانی دسته: گنجور

نمایش وزن در کادر بازشوی بیت و وزنیابی دستی دسته‌ای برای وزنیابی نشده‌ها

تا پیش از آن که با استفاده از کار بزرگ دکتر فاضل –پایگاه سرود– امکاناتی برای اضافه شدن خودکار برچسب وزن به گنجور اضافه شود وزنیابی گنجور به صورت دستی و توسط گردانندهٔ آن صورت می‌گرفت.

کاری که برای حجمی حدود پانصدهزار بیت از اشعار تا آن روز انجام شده بود (آمار بروز گنجور را اینجا ببینید).

آمار وزنیابی دستی گنجور تا سال ۹۵

بعدها سرود هم فرایند کار را خودکار، و هم آن را تسریع کرد (شاید کمی از دقت کار در مورد وزنهای خاص کم شد اما در کل دقت خروجی قابل قبول است).

اما هنوز هم حجم قابل توجهی از اشعار به دلیل کم بودن تعداد ابیات یا مسائل دیگر به صورت خودکار وزنیابی نمی‌شدند. بخشی از این اشعار با اغماض در الگوریتمهای آماری که برای جمع‌بندی نتایج اعلامی از طریق پایگاه سرود استفاده می‌شد با دقت و درستی قابل قبولی به فهرست وزنیابی‌شده‌ها اضافه شدند (کاری که می‌کنیم این است که هر مصرع را جداگانه به سرود می‌دهیم و بر اساس تعداد مصرع‌ها وقتی به تعداد خاصی نتیجه دریافت کردیم میانگین‌گیری می‌کنیم و وزن پرتکرار اعلامی را به عنوان وزن کل شعر در نظر می‌گیرم).

بخش قابل توجهی نیز با مشارکت کاربران و از طریق ویرایشگر شعر و قطعات گنجور به این آمار اضافه شد که در این میان تلاش کاربری با نام مستعار کژدم کمک بسیار مؤثری بوده است.

چند روز پیش در حین رسیدگی به کار انتشار دیوان ناصر بخارایی بر اساس تلاش جناب الف. رسته متوجه شدم که الگوریتمهای وزنیابی برای بیش از ۴۰۰۰ بیت از دیوان او به جمع‌بندی درستی نرسیده و حدود نیمی از دیوان او وزنیابی نشده.

در هنگام جستجو بر اساس وزن (مثلاً موارد وزن‌یابی نشده) و زمانی که کاربر نام‌نویسی شدهٔ گنجور وارد شده باشد دکمه‌ای برای ویرایش وزن قطعه (شعر) پیشبینی شده اما پیشنهاد وزن با آن برای تعداد زیاد شعر بسیار زمانبر و پرزحمت است چرا که هر بار باید به صفحه‌ای جدا برویم و وزن را پیشنهاد بدهیم و ذخیره کنیم و برگردیم (با وجود این همه زحمت، کاربرانی مثل کژدم با همین حجم از مشقت به تکمیل وزنیابی گنجوردر حجم بالا کمک کرده‌اند).

به نظرم رسید با اضافه کردن قابلیت پیشنهاد وزن برای اشعار وزنیابی نشده می‌توانم این فرایند را بهبود بدهم. با اضافه شدن این قابلیت ظرف چند ساعت اشعار وزنیابی نشدهٔ ناصر بخارایی را وزنیابی کردم. فیلم زیر نحوهٔ کار را نمایش می‌دهد:

علاوه بر آن از آنجا که در متون مخلوط نثر و شعر راهکار مستقیمی برای نمایش وزن اشعار پیش‌بینی نشده بود (راهکار غیرمستقیمی وجود داشت که می‌توانستید با کلیک روی دکمهٔ موارد هماهنگ در کادر مربوط به بیت، وزن را ببینید) نمایش وزن به کادر بیتها هم اضافه شد.

وزن در کادر ابیات

دیوان ناصر بخارایی

دیوان ناصر بخارایی شاعر معاصر سلمان ساوجی و حافظ شامل بیش از ۸۵۰۰ بیت شعر، به همت الف. رسته -که پیش از این نیز به همت ایشان آثار متعددی به گنجور افزوده شده- در گنجور در دسترس قرار گرفته است.

دیوان ناصر بخارایی در گنجور

دربارهٔ ناصر بخارایی از زبان جناب رسته که مدتی مدید با دیوان او همدم بوده بخوانید:

زندگینامهٔ ناصر بخارائی (۷۱۵ – ۷۹۰ ه‌.ق.)

ناصر شاعری است غزل سرا از سدهٔ هشتم هجری، هم دوران حافظ و سلمان.

گمان بر این است که او در دههٔ دوم سدهٔ هشتم زاده شده است، از همین رو دکتر مهدی درخشان فراهم آورنده و ویراستار دیوان ناصر، با نشانه‌ها و پی‌گیری رد پای او در رویدادهای تاریخی، سال تولد او را در دهّ دوم سدهٔ هشتم ۷۱۵ هجری را گرفته است. سال درگذشت او را بین سالهای ۷۸۴ تا ۷۹۰ گمانه زنی کرده است.

پیش از انقلاب مشروطه ناصر آنچنان گمنام نبوده، نسخه های خطی دیوان او تا سده‌های اخیر هم بازنویسی میشده( یکی از منابع خطی دکتر درخشانی نوشته شده در آستانهٔ انقلاب مشروطه است به سال ۱۳۰۴ قمری)، اشعار او به ویژه ترجیع بندهای او در جُنگ‌ها یافت میشود. ولی در دوران پس از مشروطه به کلی فراموش شده بود و کمتر ادیبی او را می‌شناخت . نخستین کسی که در دوران جدیدپژوهشی در بارهٔ ناصرچاپ کرد دکتر پرویز خانلری بود که در مجلهٔ سخن آبان ماه ۱۳۴۵ با نام مستعار پژوهنده در مقاله‌ای مشترکات حافظ و ناصر بخاری سنجیده است.

از سوی دیگر دکتر مهدی درخشان سرگرم تهیهٔ نسخه‌های خطی دیوان و جمع آوری اشعار ناصر میگردد و با چندین سال کار دیوان ناصر را از روی ۷ نسخهٔ خطی تهیه و تصحیح کرده و در سال ۱۳۵۳ به چاپ می‌سپرد. او در دیباچهٔ دیوان ناصر شرح بلند بالائی از یافته‌های خود در بارهٔ زندگی و شعر ناصر داده است . دیوان ناصر را می‌توانید از کتابخانهٔ مجازی دانلود کنید.

دکتر درخشان زحمت فراوانی کشیده است و باید از او سپاسگزار بود ولی روش او ناقص است. به نظر من نسخه‌ای را که دکتر درخشان به عنوان اساس گزیده است انتخاب خوبی نبوده است، در حالی که نسخهٔ بهتری در دست داشته است و آن را مبنا قرار نداده است. درخشان اختلاف نسخه‌ها را گاه در پای صفحه نوشته است و گاه ننوشته است.

همچنین نسخه‌های دیگری در کشورهای آسیای میانه، تاجیکستان، ازبکستان، روسیه (غازان) و جمهوری آذربایجان وجود دارد که گفته می‌شود نسخه‌های بهتر و قدیمی تر از نسخه های ایران و ترکیه در بین آنها وجود دارد و تا کنون در ایران در بارهٔ آن‌ها اطلاعات کمی نوشته شده است.

اگر خوانندگان گنجور از آسیای میانه به آن نسخه‌ها دسترسی داشته باشند و به ما آگاهی دهند سپاسگزار خوهیم بود که در تهیهٔ نسخهٔ بهتری از دیوان ناصر در آینده فراهم خواهد شد.

جناب رسته کار آماده‌سازی دیوان ناصر را در یک زیردامنه از گنجور به نام خود او (naser.ganjoor.net) پیش برده‌اند و در همانجا مطالب بیشتری برای استفادهٔ علاقمندان در دسترس گذاشته‌اند.

تصویر متناظر متن چاپی مرجع جناب رسته (تصحیح دکتر مهدی درخشان) نیز زیر اشعار در دسترس است.

آثار ناصر بخارایی به روال سایر آثار در دسترس از طریق گنجور، از طریق گنجور رومیزی (با دریافت مجموعه‌ها) و سایر نرم‌افزارهای سازگار با آن و همینطور از طریق کتابخانهٔ گنجور قابل دریافت است.

گنجوریار: افزونه‌ای از آقای رضا سامانی برای بدلخواهسازی گنجور در مرورگر کروم

آقای رضا سامانی که اضافه شدن حالت تیره به گنجور مرهون تلاش‌های پیشین ایشان است افزونه‌ای به نام گنجوریار برای بدلخواهسازی فونت و نحوهٔ نمایش اشعار گنجور در مرورگر کروم آماده کرده‌اند که حالت بهینه‌تری هم برای حالت تیرهٔ گنجور ارائه می‌کند.

علاقمندان می‌توانند این افزونه را از اینجا دریافت و نصب کنند.

گنجوریار از آقای رضا سامانی

بعد از نصب و فعالسازی با باز کردن گنجور و رفتن به شعر مد نظر از قسمت افزونه‌های کروم روی نشان گنجوریار کلیک کنید.

گنجوریار از آقای رضا سامانی

با استفاده از گنجوریار می‌توانید فونت نمایش اشعار را از میان ۱۲ فونت پیشنهادی انتخاب کنید، اندازهٔ فونت را تغییر دهید و فاصلهٔ بین سطور را افزایش دهید .

گنجوریار آقای رضا سامانی
گنجوریار

علاوه بر آن با امکان عریض‌سازی شعر می‌توانید با استفاده از عرض بیشتر صفحه، شعرهایی را که به لحاظ طولانی بودن متن مصاریع با اندازه‌های درشت فونتها شکسته شده نمایش داده می‌شوند بهتر ببینید.

گنجوریار آقای رضا سامانی

گنجور تاجیکی، نسخهٔ آزمایشی

تاجیکستان علی‌رغم مردم فارسی‌زبانش مخاطبان زیادی در گنجور ندارد و این البته به نظر می‌رسد ناشی از تفاوتی است که خط سیریلیک ایجاد کرده باشد.

سالها پیش در گنجور قابلیتی ایجاد کردم که برای مخاطبان با زبان مرورگر تاجیکی نسخهٔ ترجمهٔ گوگل از فارسی به خط تاجیکی را نمایش بدهیم. این قابلیت تأثیر قابل مشاهده‌ای روی وضعیت مخاطبان تاجیکستانی گنجور نگذاشت و بعدتر به دلیل مسائل فنی ناخواسته‌ای که ایجاد کرد آن قابلیت را حذف کردم.

چندی پیش در مصاحبه‌های مربوط به کتاب گنجور: قدرت بی‌نهایت کوچک‌ها و در بحث مخاطبان گنجور در مناطق مختلف جهان مهدی سلیمانیهٔ عزیز در این مورد پرسید و من را دوباره به یاد این مسئله انداخت.

علت آن که نسخهٔ ترجمهٔ گوگل گنجور مخاطب پیدا نمی‌کند می‌تواند آن باشد که عمدهٔ ورودی‌ها و آشنایی اولیهٔ مخاطبان از راه خود گوگل و موتورهای جستجوست و چون نسخهٔ ترجمهٔ گوگل در نتایج جستجو ظاهر نمی‌شود مخاطب، گنجور را نمی‌یابد.

از این جهت به نظرم رسید با ایجاد یک سایت مستقل برای مخاطبان خط تاجیکی می‌توانیم مسئلهٔ کشف‌پذیر بودن گنجور را حل کنیم.

با این اوصاف به کمک کار بزرگی که سالهاست به همت آقای جلال حجتی فهیم و در قالب پروژهٔ پرشین تاجیک انجام شده نسخهٔ اولیه‌ای از برگردان اشعار گنجور به خط تاجیکی را برای چهار شاعر (حافظ، خیام، فردوسی و مولانا) در دسترس گذاشته‌ایم.

از آنجا که در خط تاجیکی کسرهٔ اضافه بر خلاف خط فارسی همه جا نوشته می‌شود لزوماً خروجی فعلی ایده‌آل نیست. اما شروعی است برای بهبودهای آینده. امیدواریم به زودی به اضافه کردن امکاناتی چون جستجو، خوانش اشعار و نهایتاً ویرایشگر برای تصحیح اشکالات خط تاجیکی راه را برای استفادهٔ بیشتر و بهتر همزبانان تاجیک فراهم کنیم.

نسخهٔ فعلی امکان مرور سلسله‌مراتبی آثار (نوار ناوبری بالا)، مشاهدهٔ شعر یا بخش بعد و مشاهدهٔ برگردان گوگل از نسخهٔ کامل صفحهٔ متناظر در گنجور را فراهم می‌آورد.

با وجود آن که سرویس ترجمهٔ گوگل کاری بیش از نویسه‌گردانی می‌کند و کلمات را با معادلهای آنها جایگزین می‌کند می‌تواند ابزار کمکی خوبی جهت دسترسی مخاطبان تاجیکی به منابع بیشتر باشد. از این جهت روی قسمتی از اشکالاتی که در نسخهٔ ترجمهٔ گوگل گنجور دیده می‌شد کار شده و اکنون در این نسخه بیشتر آیکون‌ها و نمادهای تصویری به درستی نمایش داده می‌شوند.

ترجمهٔ گوگل از فارسی به تاجیکی

لطفاً به دوستان تاجیک خود نسخهٔ تاجیکی گنجور را به نشانی tj.ganjoor.net معرفی کنید و اگر بازخورد و پیشنهادی در این زمینه داشتند آنها را ذیل همین نوشته منعکس بفرمایید.

امیدواریم به زودی همهٔ گنجور را در این نسخه پوشش دهیم و امکانات لازم برای ویرایش و بهبود توسط خود تاجیک‌ها را ارائه کنیم.

شمار و بسیاری واژگان یک شعر

در کنار آمارهای بسامد واژگان برای کل گنجور و هر سخنور و بخش امکان شمارش تعداد و فراوانی کلمات یک شعر نیز به بخش اطلاعات آن افزوده شده است که ممکن است به طور موردی به کار پژوهشگران بیاید. تصاویر زیر گویای روش دسترسی به و نحوهٔ استفاده از این قابلیت هستند.

بخش اطلاعات شعر
برای مشاهدهٔ بسامد واژگان اینجا کلیک کنید.
بسامد واژگان شعر

پایان سرشماری بسامد واژه‌های گنجور

کار سرشماری بسامد واژگان گنجور پایان یافته و دستاورد پایانی در پایین این برگه در دسترس است:

بسامد واژگان در آمار شعرهای گنجور

از آنجا که بیشترین بسامد از آن حروف ربط و واژگان کم‌تأثیر است برای کاهش نویز و واضح‌تر شدن اطلاعات معنی‌دار امکان حذف واژگان «کم‌هوادار» از آمار صد واژهٔ ابتدایی کلی یا همهٔ بخش‌ها اضافه شده است. این واژگان را از میان دویست واژهٔ پربسامد کلی انتخاب کرده‌ایم.

بسامد واژگان در گنجور

در شاهنامه چند بار از ایران نام برده شده؟ پرکاربردترین کلمه غیر از حروف ربط و افعال پرکاربرد در رباعیات خیام کدام کلمه است؟ در غزلیات سعدی بیشتر از واژهٔ «دلبر» استفاده شده است یا از واژهٔ «معشوق»؟ به نسبت حجم کل، درصد کاربرد کلمهٔ «عشق» در غزلیات شمس بیشتر است یا در غزلیات حافظ؟

«بسامد واژگان» در فهرست‌های بخش‌های گنجور برای پاسخگویی به این دسته سؤالات ایجاد شده است. البته کلمات بر اساس شکل آنها شمارش شده‌اند و از این جهت «می» استمرار در کلمهٔ «می‌رود» با «می» به معنی شراب یک کلمه در نظر گرفته شده‌اند. کلمات شمارش شده نیز لزوماً یک کلمه نیستند و بر حسب این که با چه رسم‌الخطی در گنجور نوشته شده باشند ممکن است قسمتی از یک کلمهٔ کامل (مثالش همان «می» در «می‌رود») یا ترکیب چند کلمه باشد مثل «دیگرست» که چون فاصله‌ای بین «دیگر» و «است» وجود نداشته یک کلمه محسوب شده. در جداسازی کلمات نیز فعلاً ترجیح داده‌ایم نیم‌فاصله را نیز مانند فاصله به عنوان جداساز کلمات در نظر بگیریم.

با وجود ایرادات یاد شده می‌توان با استفاده از این ابزار، تقریبی از پاسخ‌های احتمالی برای پرسش‌های طرح شدهٔ ابتدایی را به دست آورد.

لغزش به بخش بسامد واژگان
ایران در شاهنامه
بسامد واژگان حافظ

شمارش کلمات فرایندی زمان‌بر است و تا پوشش همهٔ گنجور چند روزی طول خواهد کشید. در بخش‌هایی که کار شمارش کلماتشان تمام شده قسمتی به نام «بسامد واژگان» ظاهر می‌شود که به طور پیش‌فرض ۱۰۰ واژهٔ پربسامد آن بخش را به ترتیب نزولی بسامد نمایش می‌دهد. با تایپ کلمهٔ مورد نظر خود در کادر «جستجوی واژه» می‌توانید بسامد، ردیف آن در فهرست این واژه‌ها، تعداد و درصد تعداد آن به نسبت تعداد کل واژه‌ها را مشاهده کنید. عدد «ردیف» واژه‌ها لزوماً نمایانگر ترتیب از لحاظ بسامد نیست و تنها نمایانگر آن است که اگر فهرست صدواژهٔ ابتدایی تا واژهٔ جستجو شده ادامه پیدا می‌کرد در شماره ردیف آن چه عددی نوشته می‌شد.

با کلیک یا لمس لینک متناظر هر واژه می‌توانید آن را در بخش جاری جستجو کنید.

آمار منابع دیجیتال گنجور

بخش عمدهٔ محتوای گنجور از نرم‌افزارها و وبگاه‌های دیگر وارد شده است و در این زمینه علاقمندان ادبیات مدیون بزرگوارانی هستند که پیش و بیش از گنجور روی دیجیتالی کردن میراث ادب ایران‌زمین سرمایه‌گذاری کرده‌اند.

منبع اولیه دیجیتال هر شعر در کادر اطلاعات داخل آن مشخص شده است.

منبع اولیه

البته در طول زمان و به همت کاربران و همراهان گنجور متون وارد شده تکمیل یا تصحیح شده و تغییر کرده‌اند و لزوماً دیگر با منبع اولیه همخوانی ندارند. پیشتر در صفحهٔ منابع گنجور فهرستی ثابت از این منابع را نگهداری می‌کردیم که با فواصل طولانی تکمیل می‌شد.

برچسب‌های منابع دیجیتال گنجور را تکمیل کردیم و هم‌اکنون همهٔ شعرها دارای برچسب منبع اولیه هستند. منابع را به سه دسته (۱. نرم‌افزارها و وبگاه‌های دیگر، ۲.همراهان گنجور و ۳.پروژهٔ بازبینی OCR) تقسیم کردیم و علاوه بر یک آمار دسته‌بندی شده بر این اساس، آمار ریز ورودی از منابع را شامل نام عزیزانی که به شکل فردی یا تیمی مجموعه‌های حجیمی را برای گنجور تایپ کرده بودند در دسترس گذاشتیم.

صفحهٔ منابع

آمار کنونی فقط پوشش‌دهندهٔ بخش منظوم گنجور است. امیدواریم در آینده آماری معادل را که پوشش‌دهندهٔ بخش منثور و در نهایت همهٔ متون در دسترس از طریق گنجور باشد اضافه کنیم.

پایان کار فهرست‌گذاری خودکار متون گنجور بر اساس نسکبان

این فرایند هم‌اکنون به پایان رسیده است. در پایان این فرایند هم‌اکنون اشعار گنجور بر اساس ۳۹۵ کتاب PDF در دسترس از طریق نسکبان فهرست‌گذاری شده‌اند.

منابع کاغذی آثار هر سخنور (شامل منابع در دسترس از طریق نسکبان و گنجینهٔ گنجور) نیز ذیل صفحهٔ خود آن سخنور فهرست شده است:

منابع کاغذی حافقظ

سرور نسکبان ارتقا و بهبود پیدا کرده و امیدوارم به زودی بتوانم روی بهبود کارایی جستجو در آن وقت بگذارم. فرایند تطبیق متن کتابهای نسکبان با گنجور هنوز ایده‌آل نیست و جای کار دارد. منتهی وضعیت فعلی هم به لحاظ مستند کردن بخش قابل توجهی از متون گنجور گام بزرگ و مهمی محسوب می‌شود.