فهرست‌گذاری نسخهٔ ۸۰۱ هجری حافظ از کتابخانهٔ نورعثمانیه بر اساس گنجور

اخیراً فایل پی‌دی‌اف بخشی از این نسخه که کهن‌ترین نسخهٔ دستنویس از دیوان حافظ به شمار می‌رود روی کانالهای تلگرامی در دسترس قرار گرفته بود (اینجا و اینجا) و من آن را به نسکبان اضافه کرده بودم (متن کامل نسخه همچنان که جلوتر نقل قول می‌شود شامل اشعار شش شاعر است که هنوز جایی کامل آن را ندیده‌ام).

منتهی در نسکبان علی‌رغم وجود امکان پیشنهاد شعر متناظر صفحات کتابها بر اساس گنجور بر خلاف گنجینهٔ گنجور امکان نمایش فهرست کتاب بر اساس گنجور وجود نداشت. این امکان را اضافه کردم و این نسخه را بر اساس گنجور فهرست‌گذاری کردم.

فهرست عناوین حافظ نورعثمانیه نسخهٔ ۸۰۱ هجری بر اساس گنجور

در پایان فهرست‌گذاری این نسخهٔ خطی در گنجور علاوه بر مقدمهٔ دیوان، ۴۸۷ قطعه شعر را شناسایی کردم. بعضی اشعار در حاشیهٔ دیوان به شکل مورب نوشته شده‌اند که آنهایی که قابل قرائت بوده‌اند را نیز فهرست‌گذاری و در این آمار لحاظ کرده‌ام (این به آن معناست که مواردی که به لحاظ بریده شدن در تصویر یا از اصل ناخوانا بوده‌اند را لحاظ نکرده‌ام و از این جهت تعداد واقعی اشعار ممکن است بیش از این بوده باشد، در چاپ آقای بهروز ایمانی بر اساس این نسخه طبق مقدمه‌ای که نقل می‌شود حداکثر ۴۷۳ قطعه شعر برشمرده شده که حدس می‌زنم به خاطر آن باشد که اشعار درج شده در حاشیه‌ها را اصیل فرض نکرده‌اند).

نمونه شعر نوشته شده در گوشهٔ نسخه

به صورت بدیهی تصاویر متناظر این نسخه زیر شعرهای گنجور نیز قابل مشاهده است (هر چند به لحاظ آن که تصاویر در دسترس دو صفحه‌ای هستند و در نسخه هم در هر صفحه مصرع‌ها پشت سر هم بع شکل افقی نوشته شده‌اند و متن نسخه متراکم است پیدا کردن شعر از روی تصویر باز هم نیاز به صرف وقت توسط بازدیدکننده دارد).

تصویر حافظ نورعثمانیه زیر اشعار گنجور

در مورد این نسخه بر اساس معرفی کتاب دیوان حافظ شیرازی (کهن ترین نسخه شناخته شده کامل) به کوشش بهروز ایمانی بیشتر بدانیم:

نسخه ­برگردان دستنویس شمارۀ 5194 کتابخانۀ نور عثمانیه (استانبول)

این دستنویس کهن ترین نسخه شناخته شده و کامل از دیوان حافظ است و به شماره 5149 در کتابخانه نورعثمانیه (استانبول) نگهداری می شود و شامل 435 غزل، 1 ترجیع بند (بندی از آن)، 26 قطعه، 4 مثنوی و 11 رباعی است.بنا به گزارش ترقیمه کتابت اشعار حافظ را محمد بن عبدالله بن محمد ابوبکر بن کریمشاه ملقب به غیاث ابرقوهی در روز چهارشنبه بیستم جمادی الاول سال 801 ق به اتمام رسانده است. خط ابرقوهی از مشقهای نخستین نستعلیق نویسی پس از سده 8 ق است و جریانی را می آزماید که در آن تعلیق به نستعلیق جای می پردازد و در مسیر همین تجربه است که هنوز نستعلیق غیاث ابرقوهی از کرشمه ها و غمزه های تعلیق نیز برخوردار است.

انجامهٔ کتاب: محمد بن عبدالله بن محمد ابوبکر بن کریمشاه ملقب به غیاث ابرقوهی

 مهم ترین امتیاز این دستنویس، وجود دیباجه محمد گلندام (جامع دیوان حافظ) در آن است و تاکنون قدیم ترین نسخه از این دیباجه است که شناخته شده. غزلیات در نسخه نورعثمانیه به ترتیب الفبای قوافی تنظیم یافته و از این نکته معلوم می شود که از همان ازمنه قریب به دوره حافظ غزلیات او بر اساس قوافی سامان یافته بوده است. مقایسه و مقابله نسخه نورعثمانیه با دیگر نسخه های کهن حافظ، تفاوتهایی را در ضبط و قرائت برخی از کلمات نشان می دهد و تشابهاتی را نیز مشخص می نماید.

دستنویس شماره 5149 نورعثمانیه مجموعه ای است شامل اشعار شش شاعر که اشعار حافظ نخستین جزو از مجموعه است و برگهای 1 تا 41 آن را به خود اختصاص داده است. پس از دیوان حافظ این آثار در این مجموعه به چشم می خورد:

ــ دیوان افصح الشعراء جمال الملة والدین سلمان (برگ 43 ـ 106)

ــ روشنایی نامه از گفتار املح الکلام ملک الحکماء والمحققین ناصرخسرو (برگ 106 ـ 111)

ــ دیوان شیخ المحققین عماد الملة والدین (برگ 112 ـ 178) به همراه کتاب محبت نامه (برگ 179 ـ 189)، کتاب صفانامه (برگ 189 ـ 202)، و کتاب صحبت نامه (برگ 204 ـ 215) از همو.

ــ دیوان مرتضی المعظم جلال الملة والدین (برگ 216 ـ 249)

ــ دیوان مرتضی الاعظم کمال الملة والدین (برگ 250 ـ 267)

این اثر به کوشش و با مقدمه جناب آقای بهروز ایمانی معرفی و شناسایی شده است و در پایان آن نیز تصاویری از منابع کهن اشعار حافظ گرد آمده است.

فیلمی از فرایند فهرست‌گذاری این نسخه جهت ارجاع و استفادهٔ کاربران نیز تهیه کرده‌ام:

نحوهٔ فهرست‌گذاری کتابهای نسکبان بر اساس گنجور

ویکی‌شاهنامه: همه چیز دربارهٔ شاهنامه

ویکی‌شاهنامه به نشانی wikishahnameh.com وبگاهی بزرگ و ارزشمند است که در آن مجموعهٔ بزرگی از اطلاعات و همچنین فایلهای چندرسانه‌ای مرتبط با شاهنامه گردآوری شده است.

از متن شاهنامه مطابق چاپ مسکو به همراه روخوانی شادروان اسماعیل قادرپناه گرفته، تا تاریخ گردآوری و تدوین شاهنامه و از فهرست نسخه‌های خطی و چاپی شاهنامه -با امکان دریافت بسیاری از نسخه‌های آزاد از حق تألیف- گرفته تا فهرست تفصیلی نامهای جغرافیایی شاهنامه با نقشه و توضیحات آنها و بسیار بیشتر از اینها، از چند مجموعهٔ کامل روخوانی شاهنامه به روایت اساتید نام‌آور تا فهرست و متن چند منظومهٔ حماسی دیگر ساخته شده به تقلید از شاهنامه و انبوهی از مطالب دیگر.

wikishahnameh.com

خلاصه آن که ویکی‌شاهنامه خودش حماسه‌ای است که توسط دوستداران حماسهٔ بلند و فرهنگساز حکیم توس ساخته شده و تنها برشمردن سرفصل مطالب و محتوای آن مجالی بلند را می‌طلبد. نکتهٔ دیگر هم آن که این وبگاه ارزشمند تنها جایگاه مطالب آرشیوی نیست و زنده است و میزبان رویدادهای جدید پیرامون شاهنامه است.

علاقمندان ادبیات و دوستداران فردوسی بزرگ را به بازدید ویکی‌شاهنامه و استفاده از مطالب و منابع ارزشمند در دسترس از طریق آن دعوت می‌کنیم.

نمودارهای آمارهای گنجور

به تمام بخش‌های آماری گنجور نمودارهای متناظر آنها که امکان مقایسهٔ حداکثر ۱۰ مقدار بالای جدول آماری را فراهم می‌آورد اضافه شده است. نمودار متناظر هر جدول آماری زیر آن نمایش داده می‌شود.

نمودار آمارهای حافظ
ده وزن برتر گنجور
نمودار بسامد واژگان

آمار فراوانی تعداد ابیات شعرها

شاید برایتان سؤالاتی از این دست پیش آمده باشد که بیشتر غزلهای حافظ چند بیت دارند؟ سعدی چند بیت؟ مولانا چند بیت؟ طولانی‌تر قصیدهٔ باقیمانده از عنصری چند بیت دارد؟

با اضافه شدن آمار فراوانی تعداد ابیات اشعار به آمارهای گنجور می‌توانید پاسخ این سؤالها را بر مبنای متون در دسترس از طریق آن پیدا کنید:

آمار فراوانی تعداد ابیات غزلیات حافظ

در محاسبهٔ درصد فراوانی بر خلاف سایر آمارها نسبت را از تعداد ابیات حساب نکرده‌ایم و آن را از تعداد اشعار به دست آورده‌ایم. به همین دلیل تعداد کل اشعار را هم در سرستون ستون چهارم درج کرده‌ایم و از طریق آن اطلاعات آماری تعداد اشعار هر بخش -که پیشتر به آسانی در دسترس نبود- نیز در دسترس قرار گرفته است. آمار تعداد ابیات برای منظومه‌ها و مثنوی‌ها ممکن است آمار چندان معنی‌داری نباشد. این مسئله را در مقایسه‌ها خصوصاً در مورد عنوان بلندترین شعر بخش که پیش از این جدول نمایش داده می‌شود باید در نظر داشته باشید.

با لمس عددهای ستون «تعداد ابیات شعر» به صفحهٔ مشابه‌یابی گنجور هدایت می‌شوید و می‌توانید در آن شعرهای متناظر تعداد ابیات ارجاع شده را بیابید و یا آمار اشعار را برای از تعداد خاصی تا تعداد خاصی از ابیات را پیدا کنید (ورودی صفر برای حداقل یا حداکثر ابیات به این معنی است که آن ورودی برایتان اهمیتی ندارد و باید نادیده گرفته شود).

غزلیات ۹ بیتی مولانا در دیوان شمس

نکته‌ای که باید به آن توجه داشته باشید آن است که در اشعاری نظیر مخمس‌ها تک‌مصرع میانی بندهای شعرها را یک بیت حساب کرده‌ایم.

در این صفحه و همینطور صفحهٔ جستجو دکمه‌های حرکت بین صفحات را علاوه بر پایین در بالا هم اضافه کرده‌ایم و در قسمت پایین صفحات تعداد کل نتایج را هم نشان می‌دهیم.

تعداد کل نتایج

در قسمت اطلاعات اشعار هم تعداد ابیات را اضافه کردیم. هر چند تعداد ابیات بیشتر شعرها از روی شمارهٔ آخرین بیت قابل مشاهده است در شعرهای ترکیبی و همینطور متون منثور دارای ابیات منظوم این تعداد به آسانی قابل محاسبه نیست که به این ترتیب این مشکل هم حل می‌شود.

تعداد ابیات ترجیع بند سعدی

آمار زیربخش‌ها

به آمارهای زیر هر بخش قسمتی اضافه شده که آمار ابیات را به تفکیک زیربخش‌ها هم نشان می‌دهد. با استفاده از آن می‌توان مثلاً می‌توان تعداد ابیات هر یک از کتابهای پنج گنج نظامی را دید:

آمار خمسهٔ نظامی به تفکیک

تعداد اشعار باب‌های گلستان را مقایسه کرد:

تعداد بیتهای گلستان سعدی

و یا طولانی‌ترین بخش شاهنامه را پیدا کرد:

تعداد بیتهای بخش‌های شاهنامه

امکان حذف آثار یک یا چند شاعر از نتایج جستجو

گاهی در جستجوها ما به دنبال نتایج با حذف آثار یک یا چند شاعر هستیم مثلاً می‌خواهیم حاصل جستجوی یک کلمه را در آثار شاعرانی غیر از فردوسی و اسدی توسی بیابیم.

در نمایش نتایج جستجو دکمه‌ای زیر تصویر شاعر تعبیه شده که می‌توانید از آن برای حصول این نتیجه استفاده کنید.

حذف آثار یک شاعر از نتایج

تغییرات صفحات گنجور

با افزوده شدن خلاصه‌ها و برگردان‌های تولید شده توسط هوش مصنوعی صفحات گنجور بیش از پیش شلوغ و نیازمند اسکرول عمودی جهت رسیدن به بخش دلخواه شده بود.

برای رفع مشکل بخش‌های مختلف اَبَرداده‌های مربوط به شعر را در قالب زبانه‌های مجزا دسته‌بندی کردیم. منوی بازشوی کناری را حذف کردیم و تعداد دکمه‌های بالای شعرها را کاهش دادیم و محدود به موارد پراستفاده کردیم.

برای دسترسی به زبانه‌های ابرداده‌ها می‌توانید مطابق شکل زیر از دکمهٔ دوم از سمت راست نوار ابزار بالای صفحات گنجور استفاده کنید.

دسترسی به زبانه‌های ابرداده‌ها

زبانه‌های یاد شده در شکل زیر مشخص شده‌اند:

زبانه‌های ابرداده‌های گنجور

صفحات شاعران و بخش‌ها نیز زبانه‌بندی شده‌اند:

زبانه‌های بخش‌ها

منوی انتخاب کلمات نیز که به لحاظ عریض بودن عملاً روی صفحات موبایل قابل استفاده نبود عمودی شده و امکان جستجو در گوگل نیز به آن اضافه شده است.

منوی انتخاب کلمات گنجور

هر از چند گاه کاربرانی تماس می‌گرفتند و در مورد علت حذف شمارهٔ ابیات پیگیری می‌کردند که در واقع شمارهٔ ابیات حذف نشده بودند و فقط این دوستان سهواً روی دکمهٔ عدم نمایش شمارهٔ ابیات کلیک کرده بودند. با این تصور که ذخیرهٔ وضعیت این دکمه دلخواه کاربران نیست مدتی امکان ذخیرهٔ وضعیت آن را غیرفعال کرده بودیم. منتهی کاربران دیگری تماس گرفتند و جویای برگشت آن به وضعیت سابق بودند. از این جهت عملکرد این دکمه نیز به وضعیت سابق برگشت.

پی‌نوشت: بر اساس چند ایمیل دریافتی در این بازهٔ زمانی کوتاه به نظر می‌رسد که بیشتر دوستان با اسکرول به بخش مورد نظر می‌رسیدند و پیدا کردن حاشیه‌ها یا خوانش‌ها برای بعضی دوستان غیرممکن شده. به همین جهت طراحی صفحات شعرها مجدداً تغییر کرد و به جای مخفی کردن بخش‌های غیرفعال همهٔ بخش‌ها را نمایش می‌دهیم و بالای آنها انتخابگر بخش را تکرار می‌کنیم تا با اسکرول هم بتوان به بخش مد نظر رسید.

پروژه‌های انجام شده با اعتبار اعطایی اول‌ای‌آی

همانطور که پیشتر اشاره شد گنجور از جمله مشمولان اعطایی شرکت هوش مصنوعی اول‌ای‌آی بود.

اعتبار اول ای آی

با این اعتبار صد میلیون‌تومانی که ۴ روز پیش از سررسید انقضای آن در طول دو هفته به طور کامل مصرف شد این کارها انجام شد:

۱. تولید خلاصه‌های اشعار و برگردان به زبان ساده برای تمام ابیات و اشعار گنجور

۲. تصویرگری محتوای گنجور و تولید حدود پانزده‌هزار تصویر بر اساس آن

۳. استفاده از هوش مصنوعی برای بهبود خروجی OCR صفحات نسکبان (انجام شده برای حدود ۹ درصد از حدود نه میلیون و سیصد هزار صفحه از کتابهای نسکبان):

نمونه صفحهٔ منبع
نمونه صفحه از کتابهای نسکبان
خروجی OCR برای تصویر بالا
خروجی OCR برای تصویر بالا
خروجی OCR بازبینی شده توسط هوش مصنوعی
خروجی OCR بازبینی شده توسط هوش مصنوعی

همچنان که از تصاویر قبل و بعد بازبینی مشخص است متن خواناتر شده ولی هوش مصنوعی بخش‌هایی از متن اصلی را حذف کرده و بعضی بخشها را بازروایی کرده. متن دستکاری نشده را هم نگه داشته‌ایم و ممکن است آن را هم در صفحات در دسترس بگذاریم.

۴. استفاده از هوش مصنوعی برای استخراج فهرست مکانهای جغرافیایی مرتبط با اشعار و متون گنجور: ایده آن بوده که بعدها بتوانیم بر اساس اشارات به مکانهای جغرافیایی در محتوای گنجور جستجو کنیم یا نقشه‌هایی شبیه آنچه برای مسیر سفرنامهٔ ناصرخسرو ساخته‌ایم را راحت‌تر درست کنیم. خروجی فعلی داده‌های نامربوط زیادی دارد و شاید آن را بازبینی و یا کلاً حذف کنیم. نمونهٔ آن را در تصویر زیر در بخش «فتح بنارس» در تاریخ بیهقی می‌بینید.

مکانهای مرتبط با فتح بنارس

فانوس خیال: هزاران تصویر تولید شده با هوش مصنوعی از محتوای گنجور

از جمله کارهایی که به کمک اعتبار اول‌ای‌آی در حال انجام است (دربارهٔ آن نوشتهٔ پیشین را بخوانید) تصویرگری محتوای گنجور با هوش مصنوعی و به کمک موتور تصویرسازی دال-ای است.

روش کار به این صورت بوده که ابتدا از هوش مصنوعی خواسته‌ایم که متن یک شعر یا نثر گنجور را بررسی کند و ببیند در آن یک یا چند داستان وجود دارد یا نه. در صورتی که در آن داستانی یافت خلاصهٔ‌ آن را به نثر ساده بنویسد. سپس بر اساس این داستان یک فرمان تولید تصویر برای موتورهای تصویرسازی بسازد. سپس آن فرمان را به موتور تصویرسازی داده‌ایم و تصویر تولید شده را گرفته‌ایم و در یک مجموعهٔ اختصاصی در گنجینهٔ گنجور به نام فانوس خیال ذخیره کرده‌ایم. «قصه» یا همان خلاصهٔ تولید شده توسط هوش مصنوعی، «متن اولیه» یا همان متن شعر یا نثر گنجور و همینطور «AI Prompt» یا همان فرمان تولید تصویر را هم به صورت برچسب به آن ضمیمه کرده‌ایم. مهمتر از همه آن را به شعر منبع هم لینک کرده‌ایم و تصویر ذیل شعر در گنجور در دسترس است و از صفحهٔ تصویر نیز می‌توان به صفحهٔ گنجور رفت.

شاهدی گفت به شمعی کامشب ...
تصاویر فانوس خیال در گنجور

طبق معمول خیلی از عناصر کار مثل فهم هوش مصنوعی از متن و همینطور تصاویر تولید شده ناقص است. اما تصاویر تولید شده جالب و جذابند و ممکن است مفید باشند.

استفاده از هوش مصنوعی برای تولید خلاصه‌ها و برگردان به زبان سادهٔ ابیات

چندی پیش در لینکدین فراخوانی را از شرکت اول‌‌ای‌آی برای استفاده از طرح اول‌آورد این شرکت دیدم. طرحی که به لطف این شرکت به داوطلبان مبلغ ۱۰۰ میلیون تومان اعتبار استفاده از پلتفرمهای هوش مصنوعی به مدت محدود را می‌دهد. از طرف گنجور داوطلب شدم و این اعتبار به گنجور هم تعلق گرفت.

اعتبارات اعطا شده از سوی شرکت اول ای آی

مهمترین کاری که با این اعتبار تا به حال تکمیل شده تولید خلاصه‌های اشعار و متون منثور گنجور و همینطور تولید برگردان‌های به زبان ساده برای همهٔ ابیات و پاراگراف‌های نثر گنجور بوده.

خلاصه و برگردان به زبان ساده تولید شده توسط هوش مصنوعی

امکان درج دستی خلاصه‌ها و برگردان ابیات به نثر ساده قریب به دو سال است که روی گنجور در دسترس است. منتهی با وجود تلاش مستمر برخی همراهان فاضل گنجور روند آن طوری نیست که در زمان معقول بتواند حجم قابل توجهی از متون گنجور را پوشش دهد.

توانایی‌های هوش مصنوعی در فهم متون کهن فارسی محدود است اما از تلقی اولیهٔ من خیلی بهتر بود. این بود که به نظرم رسید غیر از آن که حجم قابل توجهی از خروجی‌های هوش مصنوعی در این زمینه خصوصاً برای دوستانی که در مطالعات ادبی تازه‌وارد و تازه‌کار محسوب می‌شوند مفید است، اضافه کردن آن می‌تواند محرک دوستان دیگر برای تصحیح و افزودن خروجی‌های انسانی باشد.

برای تفکیک نثرهای ماشینی اوّلِ همهٔ آنها نشانگر آن که با هوش مصنوعی را اضافه کرده‌ایم. هر گاه کاربری این خروجی‌ها را ویرایش می‌کند او را ملزم می‌کنیم که این عبارت را حذف کند.

ویرایش خروجی‌های هوش مصنوعی

در آینده نیز در صورت امکان استفاده از نسلهای به‌روزتر و بهتر هوش مصنوعی می‌توانیم نثرهای ماشینی را با کمک همین شاخص پیدا و جایگزین کنیم.

هوش مصنوعی قطعاً در این زمینه توانایی‌های دوستانی که به شکل حرفه‌ای با ادبیات مأنوسند را ندارد و جا به جا خروجی‌های غلط و نادرست هم تولید می‌کند. استفاده از آن در گنجور ترجیح چیزی مفید با توانایی‌های محدود بر هیچ است. از این جهت نگرانی دوستان بابت تأثیرات منفی خروجی‌های نادرست هوش مصنوعی با همت علاقمندانی که این خروجی‌ها را بهبود می‌دهند قابل رفع است.