OCR در میان دانشگاهیان و اهل فن به همین نام و یا در فارسی به نام “بازشناسی متن” مشهور است و غالبا در جستجوهایشان در گوگل نیز همین عبارات را تایپ میکنند تا ببینند در دنیای تحقیقات در زمینهی OCR چه میگذرد. ولی ظاهرا در میان مردم این فن به نامهای دیگری مشهور است که برای ما چندان آشنا نیست! در حین بررسی جستجوهای مردم برای رسیدن به سایت پرشیانگار متوجه شدم که کمتر فردی از واژه OCR به این سایت رسیده. تصمیم گرفتم با استفاده از Google Trends ببینم بیشتر مردم چه واژههایی را به جای OCR استفاده میکنند. ولی موفق نشدم! تصمیم گرفتم سری به انجمنهای مختلفی که در این رابطه موضوعاتی دارند بزنم و عباراتی را که استفاده کردهاند در گوگل جستجو کنم. به نتایج جالبی رسیدم که در زیر نتایج آن را میبینید. این نتایج بیانگر تعداد نتیجههای جستجو به ازای عبارات مختلف است (دقت کنید که تعداد نتایج اولیهای که گوگل نشان میدهد همیشه اشتباه است! و کافیست مثلا روی صفحهی ۲۰ نتایج کلیک کنید تا ببینید که تعداد واقعی نتایج بسیار کمتر از آن چیزی است که ابتدا نشان داده میشود! به عبارت عامتر گوگل در این زمینه کمی گاگول است! مثلا برای عبارت تبدیل عکس به متن ابتدا حدود ۲۲ هزار نتیجه بیان میشود ولی وقتی جلو میرویم میشود ۳۹۱ نتیجه!):
عبارت تبدیل عکس به متن: ۳۹۱نتیجه با استفاده از گیومه”" و ۶۰۵ تا بدون گیومه
عبارت OCR فارسی: ۳۷۸ و ۴۴۹ عبارت نویسه خوان: ۱۳۶ و ۶۸۸
عبارت تشخیص متن: ۱۵۵ و ۵۶۱
عبارت تصویرخوانی: ۱۳۰
عبارت بازشناسی متن: ۷۴ و ۶۷۶ عبارت تایپ خودکار:۶۲ و ۵۲۹ عبارت نویسهخوان (با استفاده از نیم فاصله): ۶۱ نتیجه
عبارت تبدیل تصویر به متن: ۵۱ و ۶۱۳
هر چند این نتایج نشان دهندهی ناآگاهی کلی جامعه از موضوعی به نام OCR است لیکن بیانگر این است که غالب مردم از عبارت تبدیل عکس به متن استفاده میکنند و عبارتی مثل بازشناسی متن تقریبا برای مردم ناشناخته است چرا که واژهی بازشناسی یک واژهی اختصاصی در رشتهی بازشناسی الگو است. همچنین این نتایج نشان میدهد که مردم ما از عکس بیشتر از تصویر خوششان میآید!
در کل به نظر میرسد زمان زیادی مانده تا OCR وارد زندگی مردم شود… ولی پرشیانگار این زمان را کاهش خواهد داد!
گوگل همواره به دنبال نوآوری و آسان کردن امور برای خود و دیگران است و همین دو موضوع هم باعث شده که گوگل، شمارهی یک دنیای وب باشد. اگر این روزها در حساب گوگل خود وارد شده باشید و سپس در گوگل جستجویی انجام دهید چیزهای جدیدی خواهید دید!
سه دکمهی جدید promote, remove, comment که به کاربر اجازه میدهد برای هر نتیجهی جستجو نظری بدهد، آن را به ابتدای لیست جستجو ارتقا دهد و یا آن را از لیست نتایج حذف کند. به عنوان مثال اگر کلمات farsi ocr را جستجو کنید، اولین نتیجه مربوط به سایت www.worldlanguage.com خواهد بود که خوب برای ما بهترین نتیجه پرشیانگار (www.persianreader.com) است. از این رو همان طور که در شکل زیر مشاهده می شود ما این نتیجه را به ابتدای لیست جستجوی گوگل آورده ایم!
ویکی جستجو
البته لازم به ذکر است که به جز نظرات که برای همه قابل رویت است، این تغییرات تنها برای شما مشخص است و از دید سایر کاربران دیده نمی شود. شما همچنین می توانید نتایجی را به جستجویتان اضافه کنید… چه بسا در آینده گوگل از این تغییراتی که کاربران ایجاد می کنند، نتایج جستجویش را بهتر کند! تا چه زاید زمان…
داشتم با نوار ابزار جستجوی گوگل (google search toolbar) بازی میکردم! نوشتم “ج” و به پیشنهادات جستجوی گوگل نگاهی کردم. یکی از پیشنهادات این بود: جوجل یشهد ان محمدا رسول الله. من بمیرم برای این عربهای بیچاره، “گ” که ندارن! که بتونن بگن گوگل، مجبورن بگن”جوجل”! گذشته این که این لغت چند دقیقه ای ما را به خنده واداشت، جملهی مذکور هم حس کنجکاوی مرا برانگیخت. آن را دنبال کردم و به یک فیلم رسیدم.
این فیلم که با کمک نقشه های گوگل (google map) تولید شده بود، نکتهی جالبی را بیان میکرد. ظاهرا در اوایل اسلام که پیامبر افرادی را به نقاط مختلف جهان برای تبلیغ دین میفرستاده، فردی به نام وبر ابن یوحناس خزاعی را به یمن فرستاده و او را دستور داده که در آنجا مسجدی در بوستان باذان، جایی که صخره غمدان وجود دارد بنا کند. قبله را نیز دستور دادند که به سمت کوه ذین بنا شود. حال فردی به نام عبدالمجید زندانی، از روی نقشه های گوگل یا به قول خودشون جوجل! به این نتیجه رسیده که اگر خط مستقیمی از محل قبلهی مسجد به سمت قله کوه ذین بکشیم و آن را امتداد دهیم دقیقا به مرکز خانهی کعبه وصل میشود. و جالب است که بدانیم فاصله بین صنعا در یمن تا خانه خدا در عربستان حدود ۸۲۰ کیلومتر است. سپس در پایان فیلم نتیجه گیری شده که پیامبر از روی هوا سخن نمیگوید: “و ما ینطق عن الهوی، ان هو الا وحی یوحی”
فیلم را در اینجا ببینید: گوگل به پیامبر ایمان دارد!
وردپرس ۲/۷ بالاخره با دنیایی از تغییرات آمد. به روز رسانی بدون کمترین مشکلی انجام شد. این نسخه واقعا ارزش به روز رسانی را دارد. دوستانی که با ورد پرس کار می کنند، بجنبند که وقت طلاست! توضیحات بیشتر را که توسط مهدی گلچین در سایت وردپرس فارسی آمده است ببینید.
امروز ایمیل جالبی برایم آمد:
یکی از هم میهنان در پیشنهادی جالب با توجه به مسائل اخیر پیش آمده و گستاخیهای امارات نوشت: چرا اسم خیابان ظفر تهران را به “خلیج فارس” عوض نمیکنند تا امارات مجبور بشه برای آدرس سفارتش از این اسم استفاده کنه ؟ در ضمن یه بخشنامه هم به پست بدهند که هر نامه ای به این آدرس بود اگر اسم خلیج فارس را ننوشته بود با ذکر علت به فرستنده ارجاع بدهند. من که خیلی با این پیشنهاد حال کردم، نظر شما چیه؟