به آمارهای زیر هر بخش قسمتی اضافه شده که آمار ابیات را به تفکیک زیربخشها هم نشان میدهد. با استفاده از آن میتوان مثلاً میتوان تعداد ابیات هر یک از کتابهای پنج گنج نظامی را دید:
گاهی در جستجوها ما به دنبال نتایج با حذف آثار یک یا چند شاعر هستیم مثلاً میخواهیم حاصل جستجوی یک کلمه را در آثار شاعرانی غیر از فردوسی و اسدی توسی بیابیم.
در نمایش نتایج جستجو دکمهای زیر تصویر شاعر تعبیه شده که میتوانید از آن برای حصول این نتیجه استفاده کنید.
با افزوده شدن خلاصهها و برگردانهای تولید شده توسط هوش مصنوعی صفحات گنجور بیش از پیش شلوغ و نیازمند اسکرول عمودی جهت رسیدن به بخش دلخواه شده بود.
برای رفع مشکل بخشهای مختلف اَبَردادههای مربوط به شعر را در قالب زبانههای مجزا دستهبندی کردیم. منوی بازشوی کناری را حذف کردیم و تعداد دکمههای بالای شعرها را کاهش دادیم و محدود به موارد پراستفاده کردیم.
برای دسترسی به زبانههای ابردادهها میتوانید مطابق شکل زیر از دکمهٔ دوم از سمت راست نوار ابزار بالای صفحات گنجور استفاده کنید.
زبانههای یاد شده در شکل زیر مشخص شدهاند:
صفحات شاعران و بخشها نیز زبانهبندی شدهاند:
منوی انتخاب کلمات نیز که به لحاظ عریض بودن عملاً روی صفحات موبایل قابل استفاده نبود عمودی شده و امکان جستجو در گوگل نیز به آن اضافه شده است.
هر از چند گاه کاربرانی تماس میگرفتند و در مورد علت حذف شمارهٔ ابیات پیگیری میکردند که در واقع شمارهٔ ابیات حذف نشده بودند و فقط این دوستان سهواً روی دکمهٔ عدم نمایش شمارهٔ ابیات کلیک کرده بودند. با این تصور که ذخیرهٔ وضعیت این دکمه دلخواه کاربران نیست مدتی امکان ذخیرهٔ وضعیت آن را غیرفعال کرده بودیم. منتهی کاربران دیگری تماس گرفتند و جویای برگشت آن به وضعیت سابق بودند. از این جهت عملکرد این دکمه نیز به وضعیت سابق برگشت.
پینوشت: بر اساس چند ایمیل دریافتی در این بازهٔ زمانی کوتاه به نظر میرسد که بیشتر دوستان با اسکرول به بخش مورد نظر میرسیدند و پیدا کردن حاشیهها یا خوانشها برای بعضی دوستان غیرممکن شده. به همین جهت طراحی صفحات شعرها مجدداً تغییر کرد و به جای مخفی کردن بخشهای غیرفعال همهٔ بخشها را نمایش میدهیم و بالای آنها انتخابگر بخش را تکرار میکنیم تا با اسکرول هم بتوان به بخش مد نظر رسید.
۳. استفاده از هوش مصنوعی برای بهبود خروجی OCR صفحات نسکبان(انجام شده برای حدود ۹ درصد از حدود نه میلیون و سیصد هزار صفحه از کتابهای نسکبان):
همچنان که از تصاویر قبل و بعد بازبینی مشخص است متن خواناتر شده ولی هوش مصنوعی بخشهایی از متن اصلی را حذف کرده و بعضی بخشها را بازروایی کرده. متن دستکاری نشده را هم نگه داشتهایم و ممکن است آن را هم در صفحات در دسترس بگذاریم.
۴. استفاده از هوش مصنوعی برای استخراج فهرست مکانهای جغرافیایی مرتبط با اشعار و متون گنجور: ایده آن بوده که بعدها بتوانیم بر اساس اشارات به مکانهای جغرافیایی در محتوای گنجور جستجو کنیم یا نقشههایی شبیه آنچه برای مسیر سفرنامهٔ ناصرخسرو ساختهایم را راحتتر درست کنیم. خروجی فعلی دادههای نامربوط زیادی دارد و شاید آن را بازبینی و یا کلاً حذف کنیم. نمونهٔ آن را در تصویر زیر در بخش «فتح بنارس» در تاریخ بیهقی میبینید.
روش کار به این صورت بوده که ابتدا از هوش مصنوعی خواستهایم که متن یک شعر یا نثر گنجور را بررسی کند و ببیند در آن یک یا چند داستان وجود دارد یا نه. در صورتی که در آن داستانی یافت خلاصهٔ آن را به نثر ساده بنویسد. سپس بر اساس این داستان یک فرمان تولید تصویر برای موتورهای تصویرسازی بسازد. سپس آن فرمان را به موتور تصویرسازی دادهایم و تصویر تولید شده را گرفتهایم و در یک مجموعهٔ اختصاصی در گنجینهٔ گنجور به نام فانوس خیال ذخیره کردهایم. «قصه» یا همان خلاصهٔ تولید شده توسط هوش مصنوعی، «متن اولیه» یا همان متن شعر یا نثر گنجور و همینطور «AI Prompt» یا همان فرمان تولید تصویر را هم به صورت برچسب به آن ضمیمه کردهایم. مهمتر از همه آن را به شعر منبع هم لینک کردهایم و تصویر ذیل شعر در گنجور در دسترس است و از صفحهٔ تصویر نیز میتوان به صفحهٔ گنجور رفت.
طبق معمول خیلی از عناصر کار مثل فهم هوش مصنوعی از متن و همینطور تصاویر تولید شده ناقص است. اما تصاویر تولید شده جالب و جذابند و ممکن است مفید باشند.
چندی پیش در لینکدین فراخوانی را از شرکت اولایآی برای استفاده از طرح اولآورد این شرکت دیدم. طرحی که به لطف این شرکت به داوطلبان مبلغ ۱۰۰ میلیون تومان اعتبار استفاده از پلتفرمهای هوش مصنوعی به مدت محدود را میدهد. از طرف گنجور داوطلب شدم و این اعتبار به گنجور هم تعلق گرفت.
مهمترین کاری که با این اعتبار تا به حال تکمیل شده تولید خلاصههای اشعار و متون منثور گنجور و همینطور تولید برگردانهای به زبان ساده برای همهٔ ابیات و پاراگرافهای نثر گنجور بوده.
امکان درج دستی خلاصهها و برگردان ابیات به نثر ساده قریب به دو سال است که روی گنجور در دسترس است. منتهی با وجود تلاش مستمر برخی همراهان فاضل گنجور روند آن طوری نیست که در زمان معقول بتواند حجم قابل توجهی از متون گنجور را پوشش دهد.
تواناییهای هوش مصنوعی در فهم متون کهن فارسی محدود است اما از تلقی اولیهٔ من خیلی بهتر بود. این بود که به نظرم رسید غیر از آن که حجم قابل توجهی از خروجیهای هوش مصنوعی در این زمینه خصوصاً برای دوستانی که در مطالعات ادبی تازهوارد و تازهکار محسوب میشوند مفید است، اضافه کردن آن میتواند محرک دوستان دیگر برای تصحیح و افزودن خروجیهای انسانی باشد.
برای تفکیک نثرهای ماشینی اوّلِ همهٔ آنها نشانگر آن که با هوش مصنوعی را اضافه کردهایم. هر گاه کاربری این خروجیها را ویرایش میکند او را ملزم میکنیم که این عبارت را حذف کند.
در آینده نیز در صورت امکان استفاده از نسلهای بهروزتر و بهتر هوش مصنوعی میتوانیم نثرهای ماشینی را با کمک همین شاخص پیدا و جایگزین کنیم.
هوش مصنوعی قطعاً در این زمینه تواناییهای دوستانی که به شکل حرفهای با ادبیات مأنوسند را ندارد و جا به جا خروجیهای غلط و نادرست هم تولید میکند. استفاده از آن در گنجور ترجیح چیزی مفید با تواناییهای محدود بر هیچ است. از این جهت نگرانی دوستان بابت تأثیرات منفی خروجیهای نادرست هوش مصنوعی با همت علاقمندانی که این خروجیها را بهبود میدهند قابل رفع است.
اخیراً و با اضافه شدن خلاصهها و برگردانهای به نثر ساده به کمک هوش مصنوعی صفحات شعرهای گنجور شلوغتر از قبل شدهاند و دوستانی راجع به این مسئله بازخورد دادهاند.
شاید راه حل نهایی این مسئله استفاده از سربرگها (تبها) باشد. اما تا آن زمان میتوانید از امکانات موجود گنجور به شرح زیر برای بهبود پیمایش صفحات استفاده کنید:
۱. در گوشهٔ سمت چپ دو دکمه برای اسکرول به بالا و پایین صفحات وجود دارد:
این دو دکمه در بیشتر موارد بسیاری از مشکلات را حل میکنند.
۲. میتوانید از دکمههای زیر عنوان شعر برای دستیابی سریع به بخشهای مختلف صفحه مثل حاشیهها و … استفاده کنید:
۳. غیر از آن امکان بستن و باز کردن هر بخش هم میتواند برای دسترسی سریع به بخش بعدی مفید باشد:
از زمان اعلان کار روی گنجور تاجیکی قریب به شش ماه میگذرد و در طول این چند ماه آقای جلال حجتی فهیم درگیر فرایند زمانبر تبدیل متن آثار روی گنجور (وگنجور رومیزی) به خط تاجیکی بودهاند.
در طول این مدت امکان جستجو نیز به گنجور تاجیکی اضافه شده است. همچنان که پیشتر عنوان شد در دسترسگذاری امکان ویرایش متن تبدیلشده توسط خود کاربران تاجیک و همینطور در دسترس قرار دادن بخشی از امکانات ضروری روی این نسخه از گنجور نیز در برنامهٔ اجرایی گنجور قرار دارد. همچنین امیدواریم در صورت فراهم شدن فرصت، نسخهای از متن تاجیکی را هم به شکل آفلاین در قالب یک برنامهٔ مجزا در دسترس قرار دهیم.
از همت و پیگیری آقای حجتی عزیز سپاسگزاریم و امیدواریم این کار قدمی مفید در جهت افزایش دسترسی فارسیزبانان تاجیک به آثار اجداد و بزرگان مشترکمان باشد.
تا پیش از آن که با استفاده از کار بزرگ دکتر فاضل –پایگاه سرود– امکاناتی برای اضافه شدن خودکار برچسب وزن به گنجور اضافه شود وزنیابی گنجور به صورت دستی و توسط گردانندهٔ آن صورت میگرفت.
کاری که برای حجمی حدود پانصدهزار بیت از اشعار تا آن روز انجام شده بود (آمار بروز گنجور را اینجا ببینید).
بعدها سرود هم فرایند کار را خودکار، و هم آن را تسریع کرد (شاید کمی از دقت کار در مورد وزنهای خاص کم شد اما در کل دقت خروجی قابل قبول است).
اما هنوز هم حجم قابل توجهی از اشعار به دلیل کم بودن تعداد ابیات یا مسائل دیگر به صورت خودکار وزنیابی نمیشدند. بخشی از این اشعار با اغماض در الگوریتمهای آماری که برای جمعبندی نتایج اعلامی از طریق پایگاه سرود استفاده میشد با دقت و درستی قابل قبولی به فهرست وزنیابیشدهها اضافه شدند (کاری که میکنیم این است که هر مصرع را جداگانه به سرود میدهیم و بر اساس تعداد مصرعها وقتی به تعداد خاصی نتیجه دریافت کردیم میانگینگیری میکنیم و وزن پرتکرار اعلامی را به عنوان وزن کل شعر در نظر میگیرم).
بخش قابل توجهی نیز با مشارکت کاربران و از طریق ویرایشگر شعر و قطعات گنجور به این آمار اضافه شد که در این میان تلاش کاربری با نام مستعار کژدم کمک بسیار مؤثری بوده است.
چند روز پیش در حین رسیدگی به کار انتشار دیوان ناصر بخارایی بر اساس تلاش جناب الف. رسته متوجه شدم که الگوریتمهای وزنیابی برای بیش از ۴۰۰۰ بیت از دیوان او به جمعبندی درستی نرسیده و حدود نیمی از دیوان او وزنیابی نشده.
در هنگام جستجو بر اساس وزن (مثلاً موارد وزنیابی نشده) و زمانی که کاربر نامنویسی شدهٔ گنجور وارد شده باشد دکمهای برای ویرایش وزن قطعه (شعر) پیشبینی شده اما پیشنهاد وزن با آن برای تعداد زیاد شعر بسیار زمانبر و پرزحمت است چرا که هر بار باید به صفحهای جدا برویم و وزن را پیشنهاد بدهیم و ذخیره کنیم و برگردیم (با وجود این همه زحمت، کاربرانی مثل کژدم با همین حجم از مشقت به تکمیل وزنیابی گنجوردر حجم بالا کمک کردهاند).
به نظرم رسید با اضافه کردن قابلیت پیشنهاد وزن برای اشعار وزنیابی نشده میتوانم این فرایند را بهبود بدهم. با اضافه شدن این قابلیت ظرف چند ساعت اشعار وزنیابی نشدهٔ ناصر بخارایی را وزنیابی کردم. فیلم زیر نحوهٔ کار را نمایش میدهد:
علاوه بر آن از آنجا که در متون مخلوط نثر و شعر راهکار مستقیمی برای نمایش وزن اشعار پیشبینی نشده بود (راهکار غیرمستقیمی وجود داشت که میتوانستید با کلیک روی دکمهٔ موارد هماهنگ در کادر مربوط به بیت، وزن را ببینید) نمایش وزن به کادر بیتها هم اضافه شد.
دیوان ناصر بخارایی شاعر معاصر سلمان ساوجی و حافظ شامل بیش از ۸۵۰۰ بیت شعر، به همت الف. رسته -که پیش از این نیز به همت ایشان آثار متعددی به گنجور افزوده شده- در گنجور در دسترس قرار گرفته است.
دربارهٔ ناصر بخارایی از زبان جناب رسته که مدتی مدید با دیوان او همدم بوده بخوانید:
زندگینامهٔ ناصر بخارائی (۷۱۵ – ۷۹۰ ه.ق.)
ناصر شاعری است غزل سرا از سدهٔ هشتم هجری، هم دوران حافظ و سلمان.
گمان بر این است که او در دههٔ دوم سدهٔ هشتم زاده شده است، از همین رو دکتر مهدی درخشان فراهم آورنده و ویراستار دیوان ناصر، با نشانهها و پیگیری رد پای او در رویدادهای تاریخی، سال تولد او را در دهّ دوم سدهٔ هشتم ۷۱۵ هجری را گرفته است. سال درگذشت او را بین سالهای ۷۸۴ تا ۷۹۰ گمانه زنی کرده است.
پیش از انقلاب مشروطه ناصر آنچنان گمنام نبوده، نسخه های خطی دیوان او تا سدههای اخیر هم بازنویسی میشده( یکی از منابع خطی دکتر درخشانی نوشته شده در آستانهٔ انقلاب مشروطه است به سال ۱۳۰۴ قمری)، اشعار او به ویژه ترجیع بندهای او در جُنگها یافت میشود. ولی در دوران پس از مشروطه به کلی فراموش شده بود و کمتر ادیبی او را میشناخت . نخستین کسی که در دوران جدیدپژوهشی در بارهٔ ناصرچاپ کرد دکتر پرویز خانلری بود که در مجلهٔ سخن آبان ماه ۱۳۴۵ با نام مستعار پژوهنده در مقالهای مشترکات حافظ و ناصر بخاری سنجیده است.
از سوی دیگر دکتر مهدی درخشان سرگرم تهیهٔ نسخههای خطی دیوان و جمع آوری اشعار ناصر میگردد و با چندین سال کار دیوان ناصر را از روی ۷ نسخهٔ خطی تهیه و تصحیح کرده و در سال ۱۳۵۳ به چاپ میسپرد. او در دیباچهٔ دیوان ناصر شرح بلند بالائی از یافتههای خود در بارهٔ زندگی و شعر ناصر داده است . دیوان ناصر را میتوانید از کتابخانهٔ مجازی دانلود کنید.
دکتر درخشان زحمت فراوانی کشیده است و باید از او سپاسگزار بود ولی روش او ناقص است. به نظر من نسخهای را که دکتر درخشان به عنوان اساس گزیده است انتخاب خوبی نبوده است، در حالی که نسخهٔ بهتری در دست داشته است و آن را مبنا قرار نداده است. درخشان اختلاف نسخهها را گاه در پای صفحه نوشته است و گاه ننوشته است.
همچنین نسخههای دیگری در کشورهای آسیای میانه، تاجیکستان، ازبکستان، روسیه (غازان) و جمهوری آذربایجان وجود دارد که گفته میشود نسخههای بهتر و قدیمی تر از نسخه های ایران و ترکیه در بین آنها وجود دارد و تا کنون در ایران در بارهٔ آنها اطلاعات کمی نوشته شده است.
اگر خوانندگان گنجور از آسیای میانه به آن نسخهها دسترسی داشته باشند و به ما آگاهی دهند سپاسگزار خوهیم بود که در تهیهٔ نسخهٔ بهتری از دیوان ناصر در آینده فراهم خواهد شد.
جناب رسته کار آمادهسازی دیوان ناصر را در یک زیردامنه از گنجور به نام خود او (naser.ganjoor.net) پیش بردهاند و در همانجا مطالب بیشتری برای استفادهٔ علاقمندان در دسترس گذاشتهاند.
تصویر متناظر متن چاپی مرجع جناب رسته (تصحیح دکتر مهدی درخشان) نیز زیر اشعار در دسترس است.
آثار ناصر بخارایی به روال سایر آثار در دسترس از طریق گنجور، از طریق گنجور رومیزی (با دریافت مجموعهها) و سایر نرمافزارهای سازگار با آن و همینطور از طریق کتابخانهٔ گنجور قابل دریافت است.