بایگانی ماه جولای، 2008

گنج را به گنجور بسپارید!

پنج‌شنبه، جولای 10th، 2008

جایی، در توضیح پیوندی که به سایت گنجور داده شده بود آمده بود که «گنجور مجموعه‌ی تقریباً کاملی از شعرهای فارسی است». این توصیف مسلماً درست نیست. به نظر شما گنجور پوشش دهنده‌ی چند درصد از ادبیات منظوم ایران است؟ عنصری، امیرمعزی، ابن‌یمین، کمال‌الدین اصفهانی، بیدل دهلوی، کلیم کاشانی، قاآنی و …! تا دلتان بخواهد می‌توان از شاعران بزرگی نام برد که حتی یک شعر کوچک از آنها در گنجور نیست. تازه به آنچه که هست -اگر نگاه کنید- بخش بزرگی از آثاری که در گنجور آمده گزیده‌های ناکامل و پرغلط از آثار شاعران است (غزلیات امیرخسرو دهلوی را محض نمونه ببینید). علت این امر هم مشخص است: تبدیل متن چاپی به متن قابل استفاده در سایتها و نرم‌افزارهای کامپیوتری نیازمند صرف وقت، هزینه و نیروی انسانی است و در مدلهای غیرتجاری و ناسودده فراهم آوردن چنین امکاناتی ممکن نیست. در نتیجه، گنجور و بسیاری از سایتهای مشابهی که این آثار را در دسترس قرار داده‌اند همگی صرفاً متکی به یک پایگاه‌داده‌های آزاد، محدود از لحاظ حجم و نسبتاً پرغلط بوده و هستند (یا احیاناً متکی هستند به پایگاه‌داده‌های نرم‌افزار درج ۷۸ از شرکت مهرارقام که از لحاظ متن –منهای دسته‌ای از غلطهای ایجاد شده توسط مشکلات سکوهای نرم‌افزاری– متن آن با ری‌را مشابهت کامل دارد).

چاره چیست؟! چرا نباید ادبیات منظوم و منثور ما، ارثیه‌ی ارزشمند ما در دسترس ما باشد؟ با توجه به عدم وجود یک مدل سودده و در عین حال آزاد برای انجام این کار، با توجه به هزینه‌های این کار چه می‌شود کرد؟

من فکری دارم. کسانی که نوشته‌های من را از طریق وبلاگ شخصیم دنبال می‌کنند این روزها مکرر راجع محصول او.سی.آر فارسی آراکس شنیده‌اند (اینجا، اینجا و اینجا را ببینید). من یک نسخه از این محصول را در اختیار دارم، به تواناییهای آن اعتقاد دارم و تصور می‌کنم این محصول می‌تواند در این زمینه کمک زیادی بکند. از لحاظ ابزارهای سخت‌افزاری کافی است اسکنری تهیه کنم و شروع به تبدیل آثار چاپی به متنهای قابل درج در گنجور کنم، این سهمی است که من می‌توانم در این کار به عهده داشته باشم: صرف وقت برای اسکن کردن آثار چاپی و درج آنها در گنجور. در حجمهای کوچک می‌توانم کار بازبینی و تصحیح غلطها را هم انجام دهم. اما ترجیح می‌دهم در صورتی که حجم ورودیها بالا باشد فکری برای شرکت دادن علاقمندان دیگر در تصحیح غلطها به صورت آنلاین به کمک تصویر نسخه‌های چاپی بکنم.

او.سی.آر شعر شهریار با آراکس

اما سهم شما: شما می‌توانید ورودیهای آن کار را تهیه کنید. اگر نسخه‌هایی از آثار شاعران فارسی‌گو را در اختیار دارید که حالت چاپی دارند (خطی نیستند، با خط نستعلیق هم نوشته نشده‌اند) و به آنها نیاز ندارید آنها را برای من بفرستید (با توجه به آن که من برای اسکن سریع این آثار نیاز دارم آنها را از هم باز کنم امیدی به برگشت آنها نداشته باشید! حتی اگر بازشان نکنم یا شرایط آنها مناسب تبدیل نباشد آنها را به عنوان هدیه از طرف شما برای خودم برمی‌دارم 😉 ). یا اگر اسکنر دارید و نمی‌خواهید اصل کتاب را از دست بدهید صفحات آن را اسکن کنید و برای من بفرستید، اگر خواستید به این شیوه عمل کنید حتماً قبل از شروع کار از طریق این صفحه با من تماس بگیرید تا در مورد حداقل دقت مورد نیاز و کیفیت اسکن راهنماییتان کنم. اگر هم آثاری را که در گنجور موجود نیست به صورت فایل متنی (و نه نرم‌افزار) در اختیار دارید آن را برای من ارسال کنید. برای اطلاع از نحوه‌ی ارسال فایل یا بسته‌ی فیزیکی کتابها از طریق این صفحه با من تماس بگیرید (در انتخاب آثار دقت کنید که آثار شاعران معاصر که تبدیل آنها به متن از مصادیق نقض حقوق مؤلفین است مناسب این کار نیستند، گزیده‌ها و گلچینها هم چندان به کار ما نمی‌آیند).

در صورت استقبال از این پیشنهاد صفحه‌ای برای ذکر نام و تشکر از کسانی که به این شیوه گنجور را یاری داده‌اند ایجاد خواهم کرد. منتظر تماس شما هستم!

تصحیحات گنجور

دوشنبه، جولای 7th، 2008

طی چند وقت اخیر چینش شعرهای ترکیبی (ترجیع بندها، ترکیب بندها و مانند آن) تصحیح شد. دوستان اگر شعری دیدند که ترکیبی است و ابیات آن به هم ریخته است اطلاع دهند. غزلیات و قصاید محتشم کاشانی که از لحاظ ترتیب مشکل داشتند نیز از نو مرتب شدند و فهرستهای الفبایی متناسب با آنها نیز تهیه شد.