بایگانی ماه مارس، 2024

معرفی «نسکبان»: جستجو در متن سی هزار کتاب فارسی

شنبه، مارس 2nd، 2024

خلاصه و اصل مطلب (اگر حوصله ندارید پاراگراف‌های بعد را بخوانید): در سایت نسکبان به نشانی naskban.ir امکان مرور و جستجو در متن بیش از سی‌هزار کتاب فارسی با قالب PDF دریافت شده از کتابخانهٔ اینترنتی سها را دارید. قابلیت‌های افزودهٔ آن بر سها، امکان جستجو در متن کتاب‌ها، نشانی‌های یکتا برای صفحات کتاب‌ها و امکان فهرست‌گذاری گنجور بر اساس کتاب‌های چاپ شدهٔ در دسترس از طریق آن است. برای دسترسی به و استفاده از آن باید در آن نام‌نویسی کنید.

پردهٔ اول: روزگاری دور (چهارده سال پیش) یکی از همراهان گنجور با من تماس گرفت و گفت شعری از پروین اعتصامی در کتابهای درسی دوران ابتداییشان بوده که اکنون در میان آثار پروین نیست. علی‌رغم آن که عموماً من از دست بردن در آثار و اضافه کردن جامانده‌های اینچنینی پرهیز می‌کنم نمی‌دانم به چه دلیل -شاید برای راضی کردن دل خودم و آقای رضا سیمی- آن را به ته مثنویات پروین چسباندم. کمی بعد دوستانی آمدند و زیر آن نوشتند که از پروین نیست و یا از ایرج میرزاست یا از عباس یمینی شریف. از آن جهت دل‌چرکین شدم و علی‌الحساب با وجود آن که شعر هنوز ذیل آثار پروین هست در عنوانش گوشزد کردم که شاعر شعر ناشناخته است.

جوجهٔ نافرمان

دوست داشتم منبع نقل این کتاب را پیدا کنم و ببینم از کیست. اما چطور؟ چطور می‌شود کتاب مرجع را پیدا کرد؟ این دغدغه با من بود تا آن که ابزارش را ساختم و در هنگام نوشتن این متن آن را یافتم: اینجا (برای مشاهدهٔ این صفحات می‌بایست در نسکبان که جلوتر معرفیش می‌کنم نام‌نویسی کنید)، کمی اینجا، کمی اینجا و کمی هم اینجا و اینجا. اما مسأله هنوز حل نشده. در کتاب چاپی نام شاعر ذکر نشده. منتهی یکی از دلایلی که امروز می‌توانم در مخزن بزرگی از کتابهای چاپی چنین جستجویی انجام دهم دغدغهٔ گشودن رمز این معما بود. معمایی که با این حکمت گشوده نشد.

پردهٔ دوم: هدف اولیهٔ ساخت گنجینهٔ گنجور افزودن آب و رنگ به حال و هوای خشک و متن‌زدهٔ گنجور با استفاده از نسخه‌های نفیس خطی خصوصاً آنها که نقاشی داشتند بود. در ادامه و با توجه به آن که برای تصحیح خطاهای تایپی نیاز بود تصویر نسخه‌های کاغذی مرجع اشعار را ببینیم تصاویر کتابهای چاپی را نیز به آن افزودم.

گنجینهٔ گنجور از آغاز برای نگهداری تصاویر باکیفیت از نسخه‌های نفیس طراحی شده بود و برای در دسترس‌گذاری کتابهای چاپی، می‌بایست آنها را از PDF به تصویر تبدیل می‌کردم. فرایندی که با وجود کاهش کیفیت تصاویر به نسبت فایل PDF مورد استفاده باعث افزایش چندبرابری حجم آن می‌شود.

به خاطر این مشکل تصمیم گرفتم که سامانه‌ای جدا برای نگهداری فایل‌های PDF طراحی کنم که در آن نیاز نباشد قالب فایل اصلی تغییر کند در عین حال بتواند امکاناتی مشابه گنجینهٔ گنجور شامل نشانی یکتا برای هر صفحه از فایل را فراهم کند. همینطور امکان فهرست‌گذاری کتاب مطابق با متن گنجور نیز در آن وجود داشته باشد.

در جستجو برای منبعی متمرکز از فایل‌های PDF قابل استفاده در ابتدا به کتابخانهٔ‌ تخصصی ادبیات و از آنجا به سها رسیدم. مجموعه‌ای عظیم از هزاران کتاب قابل دریافت در قالب PDF با ابرداده‌های توصیف‌کنندهٔ محتوای کتابها که البته من را در فیلتر و حذف کتابهای غیرفارسی آن به زحمت انداخت (عمدتاً فکر می‌کنم مشکل پیدا نشدهٔ کدهای خودم باشد) اما تلاشی که برای راه‌اندازی آن چه جمع‌آوری کتابهای پیشتر اسکن شده و چه اسکن کتابهای اسکن نشده شده شگفت‌انگیز و باورنکردنی است. به راستی که دستمریزاد!

از آنجا که حجم و جنس داده‌های پروژهٔ جدید از گنجینهٔ گنجور متفاوت بود آن را از گنجور و گنجینه‌اش جدا کردم به این معنی که اطلاعات آن در پایگاه داده‌هایی مجزا و هم‌اکنون روی سروری مجزا نگهداری می‌شود (سروری که برای پشتیبان‌گیری از گنجور تهیه شده). از این جهت کاربران نام‌نویسی شده در آن نیز با گنجور یکی نیستند و کاربران می‌بایست برای استفاده از امکانات اختصاصی در آن جداگانه نام‌نویسی کنند.

نام این سامانهٔ جدید نسکبان است (نام دامنه‌ای که سالها پیش با هدف میزبانی گنجینهٔ گنجور ثبت شده بود و با تصمیم به ثبت آن به عنوان زیردامنه‌ای از گنجور بلااستفاده مانده بود). سامانه‌ای که به نوعی خود فهرستی بر سهاست (در آینده ممکن است منابع دیگری نیز به آن افزوده شود)، اما امکانات اضافه‌ای ارائه می‌کند.

ویژگی‌ها و امکانات مهم نسکبان در حال حاضر به شرح زیر است:

۱. هر کتاب و هر صفحه از هر کتاب در آن نشانی مجزایی دارد. از این جهت می‌توانید به صفحات کتابها در آن لینک بدهید. نشانی کتاب‌ها یک عدد (شناسهٔ آنها) و شناسهٔ صفحات کتاب‌ها شمارهٔ صفحات آنها بعد از خط کج (/) جدا شده از شناسهٔ کتاب متناظرشان است.

شناسهٔ کتاب و شمارهٔ صفحه در نشانی‌های نسک‌بلن

امکان کپی آسان لینک صفحات (کتاب‌ها، صفحات کتاب‌ها و جستجوها) نیز در نظر گرفته شده است.

کپی نشانی صفحه یا کتاب به حافظه
تایپ شمارهٔ صفحه و رفتن به آن

۲. متن (تقریباً) تمام کتاب‌ها با استفاده از نرم‌افزار بازمتن تسرکت (tesseract) که از زبان فارسی نیز پشتیبانی می کند OCR شده است و می‌توانید در متن آنها بگردید (قطعاً خروجی OCR پراشکال است اما برای یافتن شواهد به اندازهٔ کافی خوب است، ضمناً با توجه به سخت‌افزار سرور فعلی نسکبان باید در جستجوی تمام‌متنی پرحوصله باشید).

جستجوی پیش‌فرض در ابرداده‌های کتاب‌ها (عناوین و نام پدیدآورندگان و …) انجام می‌شود و برای جستجو در متن کتاب‌ها باید از دکمهٔ دیگری استفاده کنید:

جستجو در متن

می‌توانید عبارتی را در متن تمام کتاب‌ها بگردید (اگر می‌خواهید عبارتی ترکیبی را به طور دقیق جستجو کنید آن را بین دو علامت قرار دهید). در صفحهٔ نتایج فهرست تمام کتاب‌هایی را خواهید دید که این متن در آنها یافت شده است.

نتایج جستجو

با انتخاب هر کتاب از نتایج نمایش داده شده، عبارت جستجو شده دوباره در متن آن کتاب جستجو می‌شود و تصاویر صفحات حاوی آن به همراه متن حاوی عبارت به صورت برجسته‌شده نمایش داده می‌شوند.

نمایش نتایج در یک کتاب

با انتخاب هر صفحه می‌توانید تصویر آن صفحه را ببینید. امکان آن که از ابتدا عبارتی را در یک کتاب خاص بگردید نیز وجود دارد. آن را باز کنید. امکان جستجو در متن آن (اگر OCR شده باشد) از کادر بالای آن وجود دارد.

جستجو در متن یک کتاب خاص

۳. کاربران می‌توانند کتاب‌ها و صفحات آنها را نشان کنند و به فهرست نشان‌شده‌هایشان دسترسی دارند.

نشان شده
نشان شده‌ها

۴. از کارکردهای ثانویه که بگذریم 😉 امکان فهرست‌گذاری صفحات کتاب‌های نسکبان با متن گنجور فراهم شده است. لذا می‌توان امیدوار بود که در آینده منابع چاپی همهٔ متون گنجور را با استفاده از آن فهرست‌گذاری کنیم. روش کار مشابه همان کاری است که در گنجینهٔ گنجور انجام شده. پس از نام‌نویسی و ورود به نسکبان، کتاب مد نظر را پیدا می‌کنیم. وارد آن می‌شویم و زیر صفحه‌ای که با شعری از گنجور مرتبط است از دکمهٔ «پیشنهاد شعر مرتبط با گنجور» به صفحه‌ای مانند شکل بعد می‌رسیم که می‌توانیم در دو سمت صفحه نسکبان و گنجور را ببینیم و بین صفحات آنها مستقلاً حرکت کنیم.

پیشنهاد شعر مرتبط در گنجور

۵. نسکبان هم‌اکنون روی سروری که برای پشتیبان‌گیری از داده‌های سرور اصلی گنجور تهیه شده میزبانی می‌شود. این سرور در ایران قرار دارد و احتمالاً با فیلترشکن‌ها و شاید با کاربران خارج از ایران مشکلاتی داشته باشد. از آنجا که مهمترین شاخص تهیهٔ این سرور فضای دیسک بوده مشخصات سخت‌افزاری خوبی هم ندارد. به این دلایل انتظار ندارم که این سرور در برابر ترافیک بالای ورودی پاسخگویی مناسبی داشته باشد. خصوصاً که جستجوی متنی داخل همهٔ کتابها نیز پردازهٔ سنگینی است. در آینده پروژه‌های امیدوارکننده‌ای مانند ایران سرچ و همینطوراحتمالاً خود سها و کتابخانهٔ ادبیات -اگر قابلیت جستجوی متنی داخل کتاب‌ها را اضافه کنند- می‌توانند جایگزین‌های پایدارتری برای نسکبان باشند و کارکرد نسکبان بیشتر به یکپارچگی آن با گنجور محدود شود. بسته به استقبال و میزان پایداری شاید در آینده سرور بهتری برای نسکبان تهیه کردم تا پاسخگویی بالاتری داشته باشد. در حال حاضر و با توجه به شلختگی کلی در طراحی و کمبود امکانات نرم‌افزاری نسکبان و همینطور سرور و سخت‌افزار زغالی با توجه به کارکردهای -در حال حاضر- به نظر بی‌نظیرش، نسکبان رتبهٔ بالاتری به نسبت گنجور در کسب عنوان «لنگه کفش کهنه در بیابان» کسب می‌کند 😉 !

نسکبان جای زیادی برای کار و بهبود دارد. برای آن که کنترل بهتری روی آن داشته باشم استفاده از آن را منوط به نام‌نویسی و ورود کاربران کرده‌ام. به این ترتیب از ایندکس شدن میلیون‌ها صفحهٔ آن روی گوگل جلوگیری می‌کنم، آمار دقیقی از میزان استفاده از آن دارم، احتمالاً حجم استفاده از آن به دلیل آن که بسیاری از سد نام‌نویسی و ایجاد حساب کاربری عبور نمی‌کنند پایین و کارایی آن با وجود سخت‌افزار ضعیف معقول باقی می‌ماند و اگر بعدها خواستم آن را واگذار کنم مالک و نگه‌دارندهٔ بعدی دست بازتری روی انتخاب آن که آن را چطور می‌خواهد در اختیار کاربر نهایی قرار دهد خواهد داشت.

حسان لاهوری

جمعه، مارس 1st، 2024

دوست عزیزی از کشور پاکستان چندی است که در گنجور فعالیت می‌کند و به سهم خود به غنای محتوای آن کمک می‌کند.

مخدوم حسان لاهوری (نامی که خود او در انتشار روخوانی‌های اشعارش در گنجور از آن استفاده می‌کند) چندی پیش جویای آن بود که چرا کسی اشعار اقبال لاهوری را نخوانده است. همچنان که در پرسش‌های متداول گنجور توضیح داده شده است روخوانی اشعار یک فرایند داوطلبانه است و انتخاب آن که چه شعری خوانده شود به عهدهٔ خود داوطلبان است. از آنجا که عموماً علاقمندان تمایل به روخوانی اشعار شاعران مشهور دارند روخوانی‌های زیادی برای جز چند شاعر انگشت‌شمار همه‌کس‌پسند ارائه نشده است. حسان عزیز وقتی که از علت این امر مطلع شد آستین همت را بالا زد و خودش دست به کار شد.

Completion of Audio Recordings: Completed the audio recording for 50 rubais of Iqbal-e-Lahori. Ganjoor has been vital in this process, especially for learning the correct pronunciation of words. When unsure about any pronunciation, I turned to Ganjoor, found the word in works of Molana, Saadi, or Hafiz, and listened to native readings. Although I am still a beginner, and no way near to a good persian accent, still the Ganjoor audios are helping in a great way.

او که فارسی‌زبان نیست با تکیه بر روخوانی‌های اشعار مشهور کلماتی را که نحوهٔ خوانده شدن آنها را در فارسی نمی‌دانسته پیدا کرده و با تلاش فراوان تا به حال بیش از پنجاه شعر از اقبال را روخوانی کرده است.

روخوانی‌های اشعار مخدوم حسان لاهوری

حسان که برنامه‌نویس و دست به کد هم هست ابزاری برای تولید فایل XML همگامسازی گنجور رومیزی با استفاده از مارکرهای ادوبی اودیشن و ابزار دیگری برای تولید ویدیوهای حاوی شکل موج در ادوبی اودیشن از خوانش‌های همگام‌شدهٔ گنجور ساخته است.

Completion of Audio Recordings: Completed the audio recording for 50 rubais of Iqbal-e-Lahori. Ganjoor has been vital in this process, especially for learning the correct pronunciation of words. When unsure about any pronunciation, I turned to Ganjoor, found the word in works of Molana, Saadi, or Hafiz, and listened to native readings. Although I am still a beginner, and no way near to a good persian accent, still the Ganjoor audios are helping in a great way.

این یک نمونه ویدیوی تولید شده توسط این ابزار است (برداشته شده از این نشانی):

حسان لاهوری و دوستانش برای شناساندن بهتر گنجینهٔ آثار اقبال لاهوری در شبکه‌های اجتماعی نیز حضور پررنگی دارند و می‌توانید در هر یک از شبکه‌های اجتماعی زیر می‌توانید حاصل تلاش‌هایشان را ببینید و دنبال کنید:

https://twitter.com/IqbalFarsi

https://instagram.com/iqbalfarsiofficial
https://www.tiktok.com/@iqbalfarsiofficial
https://www.facebook.com/IqbalFarsiOfficial
https://www.youtube.com/@IqbalFarsi

دستور خط گنجور – پیش‌نویس، نیازمند همفکری علاقمندان

جمعه، مارس 1st، 2024

منابع متون گنجور عمدتاً کتابهای چاپ شده و در معدودی موارد نسخه‌های خطی هستند. پیش از انتشار دستور خط‌های نوین مثل دستور خط فرهنگستان (اگر در دنبال کردن لینک با خطا مواجه شدید مشکل فنی و ناشی از انقضای گواهینامهٔ SSL سایت فرهنگستان است، پذیرش ریسک پیشنهادی توسط مرورگر در این مورد خاص انشاء الله خطری برایتان ایجاد نمی‌کند) منبع متمرکزی به عنوان استاندارد دستور خط وجود نداشته است. از این جهت دستور خط فارسی در کتاب‌های مختلف گنجور از سلیقه‌ها و انتخاب‌های متفاوتی پیروی می‌کنند و یکدست نیستند.

یکدست و استاندارد کردن این حجم از متن کاری نیست که در زمان معقولی انجام شدنی باشد و البته گنجور هم فاقد امکانات کافی برای چنین کاری است.

اما با ارائهٔ امکان ویرایش متون و تصحیح غلط‌های تایپی انجام این کار خصوصاً برای متون پرمخاطب شدنی‌تر و در دسترس‌تر شده است. چنانچه حرکت‌گذاری و آسان‌خوان کردن متون از اهدافی است که گروهی از همراهان گنجور با استفاده از این امکانات برای رسیدن به آن تلاش می‌کنند.

مشکلی که اینجا وجود دارد این است که در این وضعیت هم هنوز استاندارد مدون و مشخصی برای ویرایش و یکدست کردن خط در متون گنجور وجود نداشته و ارائه نشده است.

در این نوشته تلاش می‌کنیم به یک پیشنهاد اولیه بر اساس دستور خط فرهنگستان و بر اساس نیازمندیهای گنجور برسیم.

اوّل نیازمندیهای دستور خط در گنجور را با هم مرور کنیم:

۱. جستجوپذیری: یکی از مهمترین کارکردهای گنجور جستجوی متون است. دستور خط گنجور نباید برای رسیدن به اهدافی مانند آسان‌خوانی به گونه‌ای ویژه، سلیقه‌ای و غیرقابل پیش‌بینی شود که اشخاص نتوانند کلمات را مطابق صورتی که در گنجور ظاهر شده حدس بزنند و در کادر جستجو تایپ کنند. تعهد به جستجوپذیری دستور خط‌هایی را که ممکن است مزایایی از قبیل آسان‌خوانی ارائه کنند اما مطابق انتظار همگان نیستند و جا نیفتاده‌اند و استفاده از آنها نیاز به آموزش دارد نفی می‌کند.

تبصره: عموم موتورهای جستجو و همینطور جستجوگر داخلی گنجور حرکات (کسره، ضمّه، فتحه)، تشدید، همزهٔ بالای ه، تنوین و مواردی مانند آن را در جستجو نادیده می‌گیرند و آنها را حذف می‌کنند. از این جهت استفاده از این راهنماهای خوانش استاندارد مغایر با جستجوپذیری در گنجور نیست.

۲. خوانش آسان متون: شکل یک کلمه مثل «برد» در خط فارسی لزوماً نمایانگر آن نیست که کلمهٔ متناظر آن چه کلمه‌ای بوده است. این کلمه می‌تواند «بُرْد»، «بَرَد»، «بُرَد»، «بَرْد» (به معنی سرما) باشد و حتی زمانی که کلمه به مدد محتوای جمله‌ای که در آن به کار رفته مشخص شود عاملی به نام وزن شعر می‌تواند باعث شود که همان کلمه به گونه‌ای متفاوت مثلاً با تشدید روی حرف «ر» خوانده شود. حرکت‌گذاری متون تا حد زیادی می‌تواند این نقیصه را جبران کند. برای آن که کار به افراط نکشد می‌توانیم کلماتی را که کمتر پیش می‌آید به گونهٔ دیگری خوانده شوند استثنا کنیم.

قواعد پیشنهادی:

۱. در تایپ متون در ویندوز و سایر سیستم عامل‌ها از صفحه‌کلید استاندارد فارسی (Persian Standard) استفاده کنید. این صفحه‌کلید با آنچه به طور معمول در ویندوز فعال می‌شود متفاوت است. تایپ نیم‌فاصله در این چینش با Shift+Space انجام می‌شود و امکان تایپ عموم حرکات استاندارد در آن با ترکیب Shift و سایر کلیدها وجود دارد (این چینش صفحه‌کلید در ویندوزهای خیلی قدیمی با نصب برنامه‌ای جانبی در دسترس قرار می‌گیرد اما در ویندوزهای بعد از ویندوز ۱۰ و همینطور روی سیستم‌عامل‌های جدید به صورت توکار در دسترس است). معضل احتمالی این صفحه‌کلید آن است که اعداد را به شکل فارسی و متفاوت با صورت لاتین آنها تایپ می‌کند که هم در جستجوپذیری و هم در عملیات محاسباتی یا ورود متن در کادرهای محدود شده به عدد در بعضی نرم‌افزارها و وب‌سایت‌ها مشکلاتی ایجاد می‌کند که البته آن هم با سوییچ موقت به صفحه‌کلید انگلیسی و تایپ اعداد با آن حل می‌شود.

صفحه‌کلید استاندارد فارسی

۲. یای کوتاه روی های ناملفوظ (مثلاً در «نامهٔ من») به همین صورت (هٔ) و با استفاده از نشانهٔ اختصاصی آن در صفحه‌کلید استاندارد فارسی قابل تایپ با نگه داشتن دکمهٔ Shift و فشردن کلید N (یا شیفت+د) نوشته می‌شود.

تایپ یای کوتاه (هٔ)

این نویسه در دستور خط فرهنگستان (نسخهٔ لینک داده شده منتشر شده در سال ۱۴۰۲) صفحهٔ ۳۳ نیز به عنوان نویسهٔ استاندارد تایپ یای کوتاه روی های ناملفوظ انتخاب شده است. مزیت آن به نسبت صورت متفاوت متداول یعنی نوشتن کامل ی که با نیم‌فاصله از ه جدا شده (نامه‌ی من) آن است که در هنگام جستجو به طور کامل حذف می‌شود و بر خلاف صورت غیراستاندارد که حروف کامل را در جستجو حذف نمی‌کند در جستجوی عبارات کامل مثل «نامه من» به مشکل برنمی‌خورد. برای این ترکیب صورت دیگری با استفاده از یک شکل کامل (یک حرف که های ناملفوظ و یا را با هم تایپ می‌کند به صورت «ۀ») نیز با استفاده از چینش قدیمی صفحه‌کلید قابل تایپ است که به لحاظ مشکلاتی که در جستجوپذیری متن ایجاد می‌کند استفاده از آن درست نیست (نرم‌افزار گنجور در هنگام تأیید پیشنهادهای تصحیحی به طور خودکار آن را با صورت درست جایگزین می‌کند).

استثنای یای کوتاه روی های ناملفوظ: در موارد معدودی حرکت یای روی های ناملفوظ سکون است (مثال از اخوان ثالث: «به گرده‌یْ من، به رگهای فسرده‌یْ من، به زنده‌یْ تو، به مرده‌یْ من»). نوشتن آن به صورت پیشنهاد شده در این حالت به لحاظ آن که خواننده را در خوانش متن دچار اشتباه می‌کند پیشنهاد نمی‌شود و در این حالت استثنایی نوشتن آن به صورت یای کامل با سکون اجباری روی یا ارجح است.

۳. سرهم نویسی، جدانویسی: در مورد دو کلمهٔ پشت سر هم که به شکل ترکیب به کار گرفته شده‌اند (مثلاً «اینجا» یا «گر چه»)، به این قواعد نگاه کنید: اول این که در عرف آیا این ترکیب سرهم نوشته می‌شود یا جدا، مواردی مانند اینجا و آنجا معمولاً جدا نوشته نمی‌شود و البته به نظر می‌رسد تکیه در تلفظ آنها در فرم سر هم و جدا متفاوت است، از این جهت آنها را جدا نمی‌نویسیم، دوم (اگر قاعدهٔ اول این مورد را پوشش نداد) این که آیا معنای کلمهٔ ترکیبی با ترکیب دو کلمهٔ مجزا یکسان است یا خیر، اگر معنای کلمهٔ مرکب ترکیب دو بخش نیست قطعاً می‌بایست سرهم نوشته شود. سرهم‌نویسی با جدا کردن حروف چسبان با نیم‌فاصله ایرادی ندارد اما سرهم نویسی مواردی که نمی‌بایست سرهم نوشته شوند در آمارگیری کلمات مجزا در گنجور (امکانی که ممکن است بعدها ایجاد شود) مشکل ایجاد می‌کند.

۴. چسبیدن «که» به «آن» و «این» و موارد مشابه: در جایگاه‌هایی که «که» به «آن» و «این» چسبیده و ترکیب «کان» و«کاین» را ساخته، ترکیب را جدا نمی‌کنیم (که‌این و که‌آن پذیرفتنی نیست) و آنها را همانطور که خوانده می‌شوند می‌نویسیم. برای نمایش ترکیبی بودن کلمه صورت «کآن» بر «کان» و «کاین» بر «کین» ترجیح داده می‌شود. در مورد چسبیدن واو («و») به آن و این در حالتی که «وان» و «وین» خوانده می‌شود صورت‌های «وآن» و «وین» قابل قبول است («واین» احتمالاً موجب بدخوانی می‌شود). نوشتن «کآن» و «کاین» به صورت «ک‌آن» و «ک‌این» و هر گونه روشی که سلیقهٔ شخصی قلمداد شود و در متون متداول نباشد نیز درست نیست.

۵. «کی» در غزلیات شمس و «سد» در دیوان وحشی بافقی و … : تعهد به رسم‌الخط‌های اختصاصی نسخ خطی الزامی نیست و جهت جستجوپذیر کردن آنها به شرطی که مسلم باشد که کلمهٔ متداول چیست («که» به جای «کی»، «آن که» به جای «آنک»، «صد» به جای «سد»، «قفس» به جای «قفص» و …) تغییر آن به کلمهٔ متداول ترجیح داده می‌شود.

۶. استفاده از علائم سجاوندی می‌بایست مطابق کارکرد و تعریف استاندارد آنها باشد و استفاده از آنها به منظور تسهیل خوانش زمانی قابل قبول است که در آن افراط نشود و القای معنای نادرست نکند. در صورتی که یک مصرع می‌تواند با توقف در پایان کلمات مختلف به چند صورت صحیح خوانده شود نمی‌بایست علامت‌گذاری باعث نفی صورت‌های دیگر خواندن شعر شود چنان که محتمل است که شاعر عمداً قصد ایجاد ابهام روی نحوهٔ خواندن شعر را داشته است تا بتواند معانی متفاوتی را از این طریق خلق کند.

۷. علائم سجاوندی (ویرگول، علامت سؤال و علامت تعجب و …) به کلمهٔ قبلی بدون فاصله می‌چسبند و با کلمهٔ بعدی فاصله دارند (نمونه: «گفتا: کدام دل؟ چه نشان؟ کی؟ کجا؟ که برد؟» و نه «گفتا : کدام دل ؟ چه نشان ؟ کی ؟ کجا ؟ که برد ؟») .

۸. جایگاه قافیه: بعضی از قواعد رسم‌الخط در جایگاه قافیهٔ اشعار برای ایجاد یکدستی در قوافی استثناپذیر هستند. یعنی اگر رعایت رسم‌الخط صحیح در جایگاه قافیه به یکدستی قوافی یک شعر لطمه بزند از آن صرف نظر می‌کنیم.

این متن یک پیش‌نویس ناقص و اولیه است. از دوستانی که از ویراستاری و رسم‌الخط فارسی سررشته دارند و در آن مطالعه کرده‌اند و با رویکرد گنجور در مورد تسهیل جستجو در کنار تعهد به یک استاندارد عمومی و پرهیز از رویکرد سلیقه‌ای همگام و همفکر هستند خواهشمندیم نکاتی را که باید در این زمینه در نظر گرفته شود در نظرات این نوشته اعلام کنند تا به آن افزوده شود.