سيستم آرشيو الکترونيک اسناد

Wednesday, January 23, 2019 Posted by admin under General 

تکنولوژي هاي مرتبط با سيستم آرشيو الکترونيک اسناد

يک سيستم آرشيو الکترونيک اسناد براي ذخيره و قابل استفاده كردن دانش آشكار در سازمان‌ها ايجاد شده است از اين رو مي‌تواند گام اوليه‌اي براي مديريت دانش در سازمان‌ها باشد . سيستم آرشيو الکترونيک اسناد مركب از تكنولوژي‌هاي گوناگوني هستند كه تركيبات گوناگون اين تكنولوژي‌ها مي‌تواند براي ايجاد يك سيستم مديريت اطلاعات يكپارچه شوند.  مي‌توان با تركيب نرم‌افزارهاي متنوع برنامه‌هاي كاربردي با هم و با فراهم آوردن يك رابط مشترك براي آنها  از طريق desktop ، راه حلي عالي را براي مديريت اسناد سازمان‌ها و به عبارتي آرشيو الکترونيک اسناد فراهم آورد.

در اين نوشتار به تکنولوژي هاي مرتبط با سيستمهاي آرشيو الکترونيک اسناد خواهيم پرداخت :

تكنولوژي‌هاي مرتبط با  EDMS ( سيستم آرشيو الکترونيک اسناد )

  • خدمات  پايگاه داده‌ (Database Services)
  • Storage Device Drivers
  • ECM Application Services
  • تكنولوژي‌هاي هسته در EDMS

           1. تصويربرداري از اسناد  Document Imaging  (اسکن اسناد)         
           2. تكنولوژي هاي خدمات سند/ كتابخانه Document/Library services technologies
           3. گردش كار Workflow
           4. مديريت ركوردها record management

  • تكنولوژي مديريت گزارشات خبره ERM technologies
  • پردازش فرم‌ها Forms Processing
  • Optical, Mark and Intelligent Character Recognition (OCR/ICR
    براي راه‌اندازي يك سيستم آرشيو الکترونيک اسناد  (مديريت اسناد )EDMS  حداقل بايد از يكي از چهار تكنولوژي‌ هسته شامل: تصوير برداري از اسناد (اسکن مدارک )،  خدمات سند/ كتابخانه، گردش كار و مديريت ركوردها استفاده‌كرد. انتخاب تكنولوژي حمايت شده توسط EDMS   با توجه به نيازهاي سازماني كه كاربر نهايي سيستم است، تعيين مي شود. 

تکنولوژي اسکن اسناد 
تكنولوژي هاي تصويربرداري: اسکن اسناد  (Document Imaging )

تكنولوژي هاي تصويربرداري كاربران را قادر مي‌سازند تا اسناد چاپي را اسكن و وارد سيستم آرشيو الکترونيک اسناد كرده و در فرمت ديجيتالي ذخيره كنند.

اين تكنولوژي‌ها كاربران را قادر مي‌سازند تا متاديتا را نمايه و به سيستم وارد كنند. مولفه هاي اصلي سيستم‌هاي تصويربرداري اسناد عبارتند از:


  ورود اطلاعات (input)

ورود اطلاعات از طريق اسكنر صورت مي‌گيرد. ايستگاه‌هاي اسكن براي تبديل نسخه چاپي به فرمت ديجيتالي به منظور ذخيره و مديريت بعدي در سيستم آرشيو الکترونيک اسناد، مورد استفاده قرار مي‌گيرند.

قابليت‌هاي مورد نياز تكنولوژي اسكن اسناد

توانايي براي پردازش دسته اي (bache) و منفرد اسكن و نمايه اسناد
توانايي براي پشتيباني از اسكن مجدد اسناد (re-scanning)
توانايي براي پشتيباني از اسكن ساده و دوطرفه اسناد
توانايي براي ست‌كردن صفحه اي كه هنگام اسكن اسناد به صورت دسته اي يا در اسكن  اسناد طولاني جدا مي شود.
استاندارد وضوح(Resolution)
استاندارد آرشيو جورجيا در مورد وضوح :
  قابليت اسكنر براي اسكن در  وضوحي مطابق با  كيفيت مورد نياز تصاوير در سيستم آرشيو الکترونيک اسناد. براي اسناد متني حداقل 200dpi   و براي طرح هاي  مهندسي نقشه ها و ديگر اسناد حداقل 300 dpi 
استاندارد آرشيو ملي كبك كانادا در مورد استانداردهاي وضوح :
براي اسناد اداري متني، حداقل وضوح 300 dpi  است كه وضوح بالايي را براي خواندن و دستكاري در صورت لزوم فراهم مي‌آورد و فرمت هاي مختلف اسناد را پوشش مي‌دهد.
باركدها و داده ها در چك باكس:300 dpi
(Optical character recognition) OCR  300dpi 
چارت‌هاي جغرافيايي، نقشه ها ، طراحي ها و اسناد خاص: 300 – 400 dpi   يا بيشتر، بسته به تست هايي كه انجام مي‌شود.

 كنترل كيفيت براي اسكن و نمايه‌سازي اسناد
براي تعريف كنترل كيفيت اسكن و نمايه سازي، كاربر بايد بتواند:

  • بررسي و تاييد اعتبار فرايند اسكن و نمايه سازي
  • امكان اسكن مجدد تصاوير با كيفيت پايين
  • وارسي قابليت خوانايي هر صفحه از سند
  • وارسي نمايه سازي درست هر سند
  • وارسي درستي شمارش صفحات براي هر سند
  • وارسي سطح امنيت مناسب براي هرسند

آزمودن كنترل كيفيت اسكن اسناد (Quality Control Testing)، توصيه شده توسط دپارتمان حمل و نقل فلوريدا
هر روز در آغاز اسكن ، ابتدا بايد از اولين سندي كه وارد سيستم آرشيو الکترونيک اسناد شده ، پرينت گرفته شود در صورتي كه نسخه پرينت گرفته شده خوانا است سپس اسكن مي ‌تواند ادامه پيدا كند. همچنين بايد كيفيت نسخه الكترونيكي مشاهده شده روي مانيتور با نسخ اصلي و پرينت اسناد مقايسه شود. در صورت وجود مشكل در پرينتر و يا اسكنر مشكل برطرف شود. از نسخه آزمايشي چاپ شده براي مقايسه با تصويرآزمايشي روي صفحه استفاده مي شود. تصوير روي مانيتور با نسبت يك به يك ،براي اجتناب از كاهش وضوح، مشاهده مي‌شوند. 


گاهي جدا از آزمون روزانه اسكن، نياز به آزمودن آن در طول روز وجود دارد. اين در صورتي است كه : تعميرات روي تجهيزات اسكن انجام  شده باشد، تنظيمات اسكنر تغيير كرده باشد يا تغيير در نسب سخت افزار يا نرم‌افزار اسكنر انجام شده باشد. آزمودن کنترل کيفيت اسناد براي يک سيستم آرشيو الکترونيک اسناد امري ضروري است.

مرجع خبر : واحد تحقيق و توسعه دانش هم آرا


Tagged SCAN  OCR  DMS  0 Comments

چيست؟ OCR

Tuesday, January 8, 2019 Posted by admin under General 

OCR مخفف Optical Character Recognition و يا Optical Character Reader مي باشد و آن در واقع نرم افزار متن خواني است که براي تشخيص و بازيابي الفبا و نوشته هاي دست نويس يا تايپ شده طراحي شده است که در نرم افزار هايبايگاني اسناد و مدارک و نيز براي خدمات اسکن مدارک و اسناد کاربرد بسزايي دارد.

پس با اين تکنولوژي مي توان متن هاي دست نويس يا متوني را كه قبلا با ماشين تحرير تايپ شده و يا نوشته هاي چاپ شده را به صورت خودکار به متن هاي کامپيوتري تبديل نموده و در آن ذخيره کرد. يعني تبديل تصاوير کلمات به کدهاي کلمات (قابل ذخيره در داخل کامپيوتر) و مي دانيم هر متني که در کامپيوتر ذخيره شد مي توان روي آن پردازش هاي دلخواه انجام داد. مثلا آن را مي توان ويرايش کرد. يا به عنوان مثال يکي از کاربردهاي آن را مي توان تبديل حروف و نوشته هاي خطي، به خط بريل (مخصوص نابينايان) دانست و به اين ترتيب همه نوشته هاي بشر توسط نابينايان قابل خوانده شدن است.

البته استفاده از OCR تنها براي تبديل تصوير متون تايپ شده به متن تايپي نيست. بلكه هر جا شما عكسي داسته باشيد كه در قسمتي از آن حرف يا شماره اي وجود داشته باشد، سيستم OCR آن را تشخيص مي دهد. به عنوان مثال مي توان از آن در دوربين هاي هوشمند سرعت سنج جاده ها استفاده کرد. دوربين سرعت سنج؛ به صورت مستمر؛ سرعت خودرو ها را اندازه گيري مي کند و بعد از شناسائي خودروي متخلف، از پلاك خودرو عكس مي گيرد و حالا با استفاده از همين سيستم OCR و بدون دخالت انسان مي توان شماره پلاك ماشين را شناسايي كرده و در سيستم ذخيره نمود و يا آن را به مركز پليس اطلاع داد.

بعد از آنكه تصوير حاوي متن را اسكن مي كنيم رايانه پردازشي را بر روي تصوير انجام مي دهد. ابتدا تصوير را به قسمت ها يا Partitionهاي مجزا تقسيم مي كند. بعد با استفاده از الگوريتم هاي پردازش تصوير و هوش مصنوعي حروف كاراكترهايي را از درون متن استخراج مي كند. اما ممكن است متن شما هنگام عكسبرداري چرخيده باشد. در نتيجه كامپيوتر عكس را چند درجه مي چرخاند و باز عمل قبل را بر روي آن انجام مي دهد و نتيجه را به دست مي آورد. البته در اكثر موارد كار به همين راحتي كه گفته مي شود نيست و کلي عمليات پيچيده ديگر بايد روي تصوير انجام بگيرد.

مقاله مرتبط: چگونه اسناد خود را سازماندهي نماييم؟

 انواع OCR

در خط هاي ديگر؛ به ويژه زبان هايي كه با حروف لاتين نوشته مي شوند؛ سالهاست كه از OCR استفاده مي شود. اما در ايران چند سالي است كه استفاده از آن شروع شده است. OCR چند نوع است OCR براي متون تايپي و OCR براي متون دست نويس. يعني نوعي که يك متن قبلا تايپ شده (مثل كتاب يا روزنامه را مي توان وارد كامپيوتر کرد و نوعي که متن دست نويس را مي تواند بخواند).

متن هاي دست نويس هم به دو صورت گسسته و پيوسته وجود دارند: متن دست نويس پيوسته مثل همان چيزهايي است كه ما هر از گاهي كه دلمان تنگ مي شود روي كاغذ مي نويسيم، يا يك نامه، يا يك شعر و غيره. اما متن دست نويس گسسته همان نوشته هايي است كه حروف آن جدا از هم و به صورت گسسته نوشته شده اند مثل نام و نام خانوادگي كه در فرم هاي آزمون ثبت نام،‌ به صورت هر حرف داخل يك كادر نوشته مي شوند يا مثل اعداد.

 

خوشبختانه در طراحي نرم افزار مديريت اسناد شرکت دانش هم آرا  Keydoc Pro با اضافه کردن ويژگي OCR  انگليسي و فارسي توانسته ايم سازمان ها، نهاد ها،ارگان ها و شرکت هاي مختلف را از خريد نرم افزارهاي جانبي OCR و با پشتيباني محدود

 به صورت مجزا مبرا کنيم و باعث کاهش هزينه ها در نظر گرفته شده براي اسکن اسناد و مدارک، سازماندهي و مديريت هر چه بهتر اسناد و نيز تهيه يک آرشيو الکترونيکي ديجيتال از فايل ها و اسناد بايگاني شده به صورت گسترده در سطح وسيعي با کمترين دغدغه هاي ذهني و مالي براي مديران باشيم.

مرجع خبر : واحد تحقيق و توسعه دانش هم آرا


Tagged OCR  0 Comments