چگونگی کد‌گذاری داده‌های پرسشنامه‌ای دغدغهچگونگی کد‌گذاری داده‌های پرسشنامه‌ای دغدغه

 

نویسنده: حسن صانعی

 

مقدمه

مرحله جمع‌آوری اطلاعات یکی از مراحل کلیدی هر پروژه تحقیقاتی است که نقش و تاثیر بسیار زیادی بر سایر مراحل تحقیق میگذارد. این مرحله فقط شامل عملیات میدانی جمع‌آوری داده‌ها، پر کردن پرسشنامه و مراجعه‌ی آمارگیر به پاسخگو نمیباشد. بلکه کد‌گذاری (۱) داده‌های جمع‌آوری شده نیز بخش دیگری از این مرحله میباشد که تاکید و تکیه بر آن نباید از نظر محقق به دور بماند.

تعریف

کدگذاری عملی است که بدان وسیله میتوان داده‌ها را به دسته‌هایی سازماندهی کرد و به هر یک از مشاهدات، عدد یا علامت مربوط به دسته‌ای که در آن قرار میگیرد را اختصاص داد. در واقع کدگذاری همان سازماندهی منطقی داده‌ها
همان سازماندهی منطقی داده‌ها می باشد، یعنی تبدیل اطلاعات و مشاهدات جمع‌آوری شده به کدهای عددی یا نشانه‌ها است. این کدها لزوماً نشان دهنده مقدار کمی، استاندارد و ظاهری خود نبوده و بعضاً قراردادی می باشند. کدها از سوالی به سوال دیگر و حتی از موضوعی به موضوع دیگر تغییر می کنند، مفهوم قبلی خود را از دست داده و معنای جدیدی را می گیرند. مثلاً در کدگذاری سوالی مربوط به جنس، کد ۲ ممکن است برای “جنس مونث” در نظر گرفته شده باشد، در حالی که در کد گذاری سوالی مربوط به وضعیت نظام وظیفه، کد ۲ ممکن است برای “فرد معاف از خدمت” در نظر گرفته شود یا در کد‌گذاری سوالی مربوط به مدرک تحصیلی، کد ۲ ممکن است به معنای “داشتن پایان دوره ابتدایی” باشد. همانگونه که ملاحظه می شود در مثال های فوق کد ۲ مفهوم عدد ۲ را ندارند و صرفاً قراردادی است بنابراین می توان گفت که کد‌گذاری فرآیند تبدیل اطلاعات به فرمت ساده شده و راحت‌تر (معمولاً عددی) می‌باشد بگونه‌ای که بتوان با کمک انها تجزیه و تحلیل سیستماتیک داده‌ها را به نحو موثرتر و آسان‌تری به انجام رساند.

زمان کدگذاری

کدگذاری در کدامین مرحله طرح و چه زمانی باید انجام شود؟ این سوالی است که اغلب مورد پرسش قرار می گیرد. کدگذاری را می توان در هر مرحله ای مابین طراحی و تنظیم پرسشنامه، حتی تا قبل از استخراج جداول انجام داد. البته همانگونه که بعداً اشاره خواهد شد، توصیه می شود که کدگذاری پرسشنامه از همان زمان طراحی پرسشنامه شروع شود. بدین منظور حتی‌الامکان به جای سوالات تشریحی و باز از سوالات چند گزینه‌ای و بسته استفاده شود. در مقابل هر گزینه سوال بسته یک کادر یا خانه خالی در نظر گرفته و برای هر کدام از این خانه‌ها کدی را که در بالای آن خانه نوشته می شود، اختصاص دهید تا در موقع مصاحبه و تکمیل پرسشنامه، علامت زده شود. بدین ترتیب وقتی که پرسشگر پرسشنامه را تکمیل می کند در گزینه یا کد مربوطه، علامتی خواهد گذاشت. این نوع سوالات، سوال از پیش کدبندی شده نامیده می شوند.
طراحی پرسشنامه به گونه ای که عمل کدگذاری از همان هنگام جمع‌آوری اطلاعات شروع شود، مورد تاکید می باشد. این کار موجب می شود تا ضمن آموزش پرسشگران به این مهم، دقت در جمع‌آوری داده‌ها نیز مبذول گردد و از این طریق بعضی ابهامات احتمالی برطرف شود. در نتیجه صرفه‌جویی در وقت و امکانات را به دنبال خواهد داشت. علاوه بر این، مراحل بعدی تحقیق مخصوصاً بازبینی پرسشنامه‌ها را آسان‌تر می کند. مضافاً بر اینکه استفاده از سوالات از پیش کدبندی شده و انجام کدگذاری هم زمان با تکمیل پرسشنامه نیازی به تکمیل و پر کردن برگه انتقال کد ندارد و در نتیجه اشتباه کمتری مرتکب خواهیم شد.
علاوه بر این، بایستی یک نفر یا یک تیم مسئولیت تکمیل کدگذاری داده‌ها یا بازنگری کدگذاری انجام شده را در مرحله پایانی جمع‌آوری اطلاعات برعهده بگیرد. ضروری است که این شخص پس از انجام وظیفه خود، پرسشنامه را امضاء نماید.
بهترین فرد برای کدگذاری سوالات بسته، خود مصاحبه‌گر است، زیرا وی نظر و پاسخ کامل پاسخگو را شنیده است و اطلاعات بیشتری نسبت به بقیه افراد در اختیار دارد.

ضرورت کدگذاری

چرا باید اطلاعات و مشاهدات جمع‌آوری شده را کدگذاری نمود؟ این سوالی است که بسیاری از محققین بدون پاسخ به آن، کدگذاری اطلاعات خود را به عنوان یک عرف مقبول و پذیرفته شده انجام می دهند. از جمله دلایل کدگذاری پرسشنامه و اطلاعات آن می توان:
• سهولت در ورود اطلاعات کامپیوتر
• سهولت در استخراج داده‌ها،
• سهولت در تجزیه و تحلیل داده‌ها.
را نام برد که خود موجب صرفه‌جویی در وقت، امکانات، منابع و هزینه‌ها خواهد شد.
داده‌هایی که به وسیله پرسشنامه جمع‌آوری می‌شود، یک متن است که فایل آن نیز به صورت متنی می‌باشد. به منظور استفاده از این فایل دو راه وجود دارد: یا باید داده‌های پرسشنامه را اسکن نموده و از این طریق آنها را وارد سیستم نمود. لازمه چنین کاری، نوشتن اطلاعات جمع‌آوری شده به زبان انگلیسی و به صورت تایپ شده می باشد. زیرا تقریباً تمامی نرم افزارهای مورد استفاده در تجزیه و تحلیل، زبان انگلیسی را تشخیص می‌دهند. راه متداول‌تر در تحقیقات کوچک این است که ابتدا پاسخ‌های آن را به مجموعه‌ای از نشانه‌های شناخته شده و تعریف شده تبدیل نموده و سپس وارد کامپیوتر کرد.
به منظور توجیه صرفه‌جویی امکانات، صفحه کامپیوتری که اطلاعات شما در آن ذخیره می‌گردد را به صورت یک صفحه شطرنجی در نظر بگیرید که در هر خانه آن فقط و فقط یک علامت، حرف یا عدد جای می گیرد. اگر هر سطر این صفحه مفروض برای اطلاعات جمع‌آوری شده را یک فرد نمونه اختصاص دهیم، ستون‌های آن برای ثبت و نگهداری متغیرها یا صفت‌های آن فرد مورد بررسی اختصاص خواهد یافت.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

حال اگر مثلاً بخواهید جنس هر پاسخگو را وارد کنید، باید کلماتی چون (مرد،پسر، مذکر) یا (زن، دختر، مونث) یا معادل انگلیسی آنها را وارد نمایید. برای وارد کردن وضعیت تاهل پاسخگو نیز بایستی یکی از حالات (متاهل، مجرد، بیوه یا مطلقه و …) را وارد نمود. همانگونه که می بینیم حداقل کاراکتر مورد نیاز برای هر کدام از اینها، بطور متوسط ۱۵-۱۰ خانه از صفحه مفروض فوق می‌باشد. در حالی که با انجام کدگذاری، اختصاص فقط ی کاراکتر (یک خانه از صفحه فوق) برای آن کفایت می کند. این امر نه فقط موجب صرفه‌جویی در حافظه کامپیوتر می‌شود، بلکه باعث صرفه‌جویی در وقت، نیروی انسانی و سایر هزینه‌ها نیز می گردد. از طرفی دیگر، در پاسخ داده شده به این سوالات از طرف پاسخگویان، ممکن است واژه‌ها و مفاهیم معادل دیگری ارائه شود که تعداد پاسخ‌های ممکن را خیلی زیاد نماید که خود موجب بروز اشکالاتی در استخراج جداول می‌گردد. لذا نیاز به معادل‌سازی و همگروه کردن بعضی پاسخ‌ها با یکدیگر الزامی خواهد شد. این نیز، خود بخشی از عملیات کدگذاری می‌باشد.

مراحل کدگذاری

فرآیند کدگذاری دارای شش مرحله به شرح نمودار شماره ۳ است.
۱- نخست باید پاسخ های ممکن یک سوال بررسی شود. این کار از طریق بررسی مطالعات دیگر (نه فقط مطالعات مشابه) که به این سوال پرداخته اند، میسر می‌باشد. در صورت در دسترس بودن جزییات مطالعات قبلی، بررسی جدول توزیع فراوانی متغیر موردنظر بسیار مفید و راهگشا می‌باشد. در غیر این صورت، استفاده از مطالعه مقدماتی، استخراج هر سوال در یک ورقه و شمارش فراوانی هر سوال می‌تواند راهگشا باشد.

اسکن

نمودار شماره ۳- مراحل کدگذاری یک پرسشنامه
۲- درباره کدهای مورد نیاز یا ادغام بعضی دسته‌ها در مطالعه حاضر تصمیم‌گیری شود. چنانچه در این مطالعه، بعضی از دسته‌ها از اهمیت کمتری برخوردار باشند یا فراوانی اندکی داشته باشند، محقق می‌تواند درباره ادغام بعضی از آنها تصمیم بگیرد که این مرحله بستگی به موضوع مورد بررسی دارد.
۳- تهیه دفترچه یا دستورالعمل کدگذاری که جزییات کدگذاری و مقادیر واقعی آنها را بیان می کند.
۴- آزمایش کدهای اختصاص یافته به منظور حصول اطمینان از جامع بودن کدهای در نظر گرفته شده.
۵- قرار دادن و انطباق جواب پاسخگویان در دسته‌های کدبندی شده.
۶- بالاخره کنترل و بازرسی کار کدگذاران در طول جریان کدگذاری.

دفترچه کدگذاری

راهنما و دفترچه کدگذاری مدرکی است که شامل نقشه و رمز کار برای سازمان دهی داده‌ها می باشد. به عبارتی دیگر، وسیله ای جهت بیان موقعیت متغیرها و فهرست کدها می باشد و تهیه آن الزامی است. این دفترچه دارای دو هدف می باشد: نخست آنکه کدهای عادی را برای داده‌ها و موقعیت هر کدام از متغیرها در مجموعه داده‌ها بیان می نماید. ثانیاً وقتی که تجزیه و تحلیل داده‌ها آغاز شود، از آن به عنوان مرجع یا فرهنگ داده‌ها استفاده می شود. به همین جهت برخی آن را همانند یک فرهنگ لغات بیگانه می پندارند که پاسخ‌های متن فارسی یا انگلیسی را به اعداد، کدها یا مقادیر طبقات ترجمه می نماید. بنابراین، می تواند در دو زمان مورد استفاده محقق واقع شود:
•ابتدا زمانی که فرآیند کدگذاری در حال انجام است و معمولاً قبل از مرحله ورود اطلاعات به کامپیوتر می‌باشد.
•سپس زمانی که داده‌ها مورد تجزیه و تحلیل و تفسیر واقع می‌شود، این دفترچه کمک مفید و شایانی جهت تفسیر داده‌ها خواهد کرد.
لذا توصیه می شود که برای کدگذاری، فقط به حافظه بسنده نشود و از به ذهن سپردن راهنمای کدگذاری شدیداً اجتناب گردد. این پرهیز مخصوصاً برای کدگذاران (حتی بعد از اینکه تعدادی پرسشنامه را کدگذاری نمودند) ضروری است. به راهنما و دفترچه کدگذاری “دستورالعمل کدگذاری” نیز گفته می شود.
از مزایای دیگری که برای تهیه دفتر چه کد می توان نام برد، بهبود ابزار تحقیق است. بدین معنا که وقتی که برای پاسخ های یک سوال کدی در نظر گرفته می شود، ابهامات در سوالات یا گزینه های پاسخ نیز تا حدودی مشخص و تصحیح می شود.
از آنجایی که استخراج و ورود داده‌ها به کامپیوتر از طریق نرم افزارها می باشد، اکثر نرم افزارها در مرحله
تعریف متغیر برای متغیرهای کدگذاری شده “برچسب (Label)” را تعریف می کنند که با استفاده از آن می‌توان کدها را تعریف نمود و تا حدودی نیاز به استفاده از دستورالعمل کدگذاری را در مرحله دوم برطرف می سازد.
پس از اتمام تهیه دستورالعمل کدگذاری، بایستی نمونه کوچک دیگری از پرسشنامه های تکمیل شده را به منظور آزمایش کدهای جدید انتخاب نمود و پس از حصول اطمینان از جامع بودن کدهای در نظر گرفته شده، آنها را برای انجام وظیفه در اختیار کدگذاران قرار داد.
در دفترچه کد اطلاعات متفاوتی را می توان گنجانید. ولی به طور کلی آوردن حداقل چهار نوع اطلاعات در دفترچه کد ضروری است:
۱- نام متغیر: این نام به منظور مشخص کردن نوع اطلاعات جمع‌آوری شده از هر مشاهده استفاده می شود.
برای مثال “هر چند وقت یک بار به خرید می‌روید؟” را می‌توان با SHOPFREQ مشخص نمود. یا

چگونگی کد‌گذاری داده‌های پرسشنامه‌ای دغدغه

یا ” چه کسی معمولاً لیست خرید را تهیه می کند” را باWholist و “تعداد افرادی که در خانواده شما زندگی می کنند” را باFamsize مشخص کرد. قاعده عملی خوب برای نامگذاری یک متغیر آن است که در نگاه اول به خروجی کامپیوتری، بتوان مفهوم آن متغیر را درک نمود. اکثر نرم افزارهای کامپیوتری آماری نظیر؛SAS, SPSS Minitab, Stata, Splus, Arcus و … تعداد محدودی کاراکتر برای طول نام متغیر اختصاص داده‌اند (حدود ۸ کاراکتر) که باید در هنگام تعیین نام متغیر به این مفهوم توجه نمود.
۲- موقعیت سطری و ستونی متغیر: موقعیت سطری و ستونی دلالت بر محلی دارد که بتوان یک متغیر خاص از مجموعه داده‌ها را در آنجا یافت. اگر برای هر یک از مشاهدات بیش از ۸۰ ستون لازم باشد، بایستی از چند سطر یا چند کارت استفاده نمود. شماره سطر را می توان برای مشخص کردن سطر یا کارتی که داده های یک مشاهده (یک فرد) در آن جای دارد، استفاده نمود یا اینکه طول یک سطر را با بیش از ۸۰ کاراکتر تعریف کرد. ستونها نیز جایی از یک سطر مخصوصی را که داده های یک متغیر در آن قرار دارند را توصیف می نماید.
۳- اطلاعات توصیفی- تکمیلی: این اطلاعات تعریف متغیر موردنظر را به صورت متنی توصیفی شامل می شود. به عبارتی دیگر، مفهوم متغیر مورد بررسی را با وضوح بیشتر ی بیان می کند و هم ترازlabelدر اکثر نرم افزارهای آماری است.
۴- کدهای عددی: کدهای عددی، اعداد و کاراکترهایی هستند که به عنوان کد به هر یک از پاسخ‌های ممکن سوال تحقیق اختصاص داده شده اند. برای مثال اگر سوالی در مورد جنس پاسخگو پرسیده شده باشد، می توان کد ۱ را برای مردان و کد ۲ را برای زنان در نظر گرفت. یادآوری این نکته ضروری است که متغیرهای طبقه‌بندی شده باید کدهای منحصر به فرد و جامعی را داشته باشند. بدین معنا که پاسخ یک فرد به یک سوال، باید فقط و فقط به یک گزینه اختصاص داده شود. از طرفی دیگر، پاسخ هیچ فردی نباید بدون گزینه باشد. برای متغیرهای کمی (پیوسته یا یا گسسته، فاصله ای یا نسبتی) نظیر سن پاسخگو، تعداد افراد خانواده، دمای شهر یا وزن و قد افراد، بایستی حتماً مقادیر واقعی آنها را استفاده نمود و کدی برای آنها در نظر نگرفت، مگر آنکه بخواهیم خود این اطلاعات را گروه‌بندی کنیم. در این صورت باید از کدهای ترتیبی استفاده نمود. این اقدام به محقق این امکان را می دهد تا داده‌های را در مرحله تجزیه و تحلیل به نحوی مفیدتری استفاده نماید. در جدول زیر نمونه ای از یک صفحه دفترچه کدنشان داده شده است.

نام متغیر

ستون‌ها

اطلاعات توصیفی

کدها

Province

۲-۱

کد استان

۲۳

ID

۵-۳

شماره شناسایی پاسخگو

عددی

FamSize

۶

تعداد افرادی که در خانواده شما زندگی می کنند؟

عددی بین ۱ تا ۹

Shopfreq

۷

هر چند وقت یک بار به خرید می روید؟

۱= یک بار در ماه، ۲= هر دو هفته یکبار، ۳= هفته ای یک بار، ۴= بیشتر از یک بار در هفته، ۵= به ندرت، ۶= نامعلوم

Shop At

۸

خریدتان را در کجا انجام می دهید؟

۱= نزدیکترین مغازه، ۲= فروشگاه تعاونی، ۳= فروشگاه زنجیره‌ای، ۴= هر بار یکجا، ۵=متفرقه

Wholist

۹

معمولاً چه کسی لیست خرید را تهیه می کند؟

۰= لیست نداریم، ۱= مادر، ۲= پدر، ۳=هردو، ۴=خواهر بزرگتر، ۵=برادر بزرگتر، ۶= هر دفعه یکی، ۹= نامعلوم 

 

Whoshop

۱۰

چه کسی معمولاً به خرید می رود؟

۱= مادر، ۲= پدر، ۳= هر دو، ۴= خواهر بزرگتر، ۵= برادر بزرگتر، ۶= هر دفعه، یکی، ۹= نامعلوم

Spend

۱۸-۱۱

بطور متوسط هفتگی چه مبلغ خرید می کنید؟

مبلغ به ریال

شیوه کدگذاری

کدگذاری حتی‌الامکان بایستی ساده و روان باشد تا زمینه اشتباه پرسشگر یا حتی کدگذار فراهم نگردد. از طرفی دیگر، چون تقریباً تجزیه و تحلیل تمام مجموعه داده‌های بزرگ به وسیله کامپیوتر اجرا می‌گردد، سیستم کدگذاری مورد استفاده باید به گونه‌ای باشد تا به راحتی قابل تبدیل به فرمت موردنیاز نرم‌افزار کامپیوتری باشد تا بتواند مدلسازی نماید.
از طرفی دیگر، ممکن است در تحقیق به عللی نتوان داده‌های مربوط به یک یا چند متغیر را به دست آورد. در این صورت با مشکل مقادیر گمشده مواجه خواهیم شد. اکثر نرم‌افزارهای آماری با مقادیر گمشده رفتارهای مختلفی دارند. بدین منظور گزینه‌هایی را مشخص می‌کنند که کدام مقادیر باید به عنوان مقدار گمشده مورد بررسی قرار گیرد و این امکان را برای کامپیوتر فراهم می‌آورند تا جاهای خالی یا علامت خاصی را به عنوان گمشده تلقی نمایند. اما چنانچه محقق مایل باشد می‌تواند عدد خاصی را به عنوان کد مقادیر گمشده جایگزین نماید. در این صورت، حتما باید این کد یا عدد خاص به نرم افزار معرفی گردد.
در زیر پاره ای از نکات ضروری که در کد گذاری داده‌ها باید اعمال شود، بطور مستقل بیان می‌شود .
•درکد گذاری سوال توصیه می‌شود که پاسخ سوال را هر چه بیشتر به صورت جزییات در نظر گرفته شود تا پاسخ‌های کلی. زیرا در مراحل بعدی طرح تحقیقاتی، ادغام چند کد و دسته که اطلاعات ریز آن جمع‌آوری شده باشد آسان است. در حالی که تجزیه دسته‌های کلی‌تر به جزیی‌تر تقریباً ممکن نمی باشد.
•در پرسش‌هایی که جواب انصاری و قطعی دارند، مثل جنس پاسخگو که پاسخ آن فقط و فقط می‌تواند به صورت‌های مشخصی مثل (زن و مرد)، (مونث و مذکر) یا (دختر و پسر) باشد و انتخاب دیگری برای آن متصور نیست، می بایست کد یک رقمی مثل (۱،۰) یا (۲،۱) یا حتی (۷،۴) یا به صورت کاراکتری (Mو F) برای آن در نظر گرفت (هر چند برای انجام تجزیه و تحلیل آماری با نرم افزارهای کامپیوتری، استفاده از کدهای عددی برچسب‌دار بهتر و ارجح‌تر از کدهای کاراکتری است).
•موضوع دیگری که در کدگذاری باید مورد توجه قرار گیرد، پیش‌بینی حالتی برای مواردی است که جواب پاسخگو نمی تواند هیچ یک از موارد پیش‌بینی شده در پرسشنامه باشد و در حقیقت دلالت بر نفی و رد همه گزینه‌ها دارد. مثلاً وقتی از پاسخگویی درباره استفاده از خدمات شهری سوال می‌شود، پاسخگو ممکن است از همه خدمات، از بعضی از خدمات یا از هیچیکدام از این خدمات استفاده نکند.
آب ….. فاضلاب ….. برق ……. مخابرات …… گاز…… خانه…… بهداشت….. پست ……..
بنابراین در این سوال باید گزینه‌ای با عنوان “هیچ کدام…. ” برای آن دسته از پاسخگویانی که اصلاً از خدمات فوق استفاده نمی کنند، پیش‌بینی نمود.
•حالت دیگر، سوالاتی هستند که پاسخ آنها می‌تواند “نامعلوم”، “اظهار نشده”، “نظری ندارد” یا “نمی‌داند” باشد. برای مثال سوالات مربوط به نظرخواهی‌ها که پاسخ آنها می‌تواند به صورت:
عالی ….. خوب ….. متوسط ….. ضعیف ….. بد …….
در نظر گرفته می‌شود. علاوه بر آنها کد دیگری باید برای آن دسته از پاسخگویان پیش‌بینی نمود که به هر دلیلی از بیان جواب قطعی طفره می‌روند. این کد معمولا با ۹ یا ۹۹ نشان داده خواهد شد. (۲)
•برخی دیگر از متغیرهایی که به صورت از پیش کدبندی شده سوال می‌شوند، دارای گزینه‌های انحصاری نمی‌باشند و ممکن است پاسخ های بالقوه ی زیادی داشته باشند. لیکن برخی از این پاسخ‌ها برای محقق قابل پیش‌بینی نبوده یا از اهمیت کمتری برخوردارند و با تعداد موارد مشابه شده (فراوانی) آنها بسیار کم می‌باشد. لذا در نظر گرفتن یک خانه با عنوان “سایر” اهمیت پیدا می‌کند. این کد نیز بهتر است آخرین کد بعد از کدهای مشخص شده و قبل از کد نامعلوم (۹ یا ۹۹) باشد. باید توجه کافی مبذول داشت که گزینه‌های قابل پیش‌بینی در “سایر” گنجانده نشود. زیرا این کد فقط برای گزینه‌ها و پاسخ‌های کم اهمیت و یا با فراوانی کم و یا غیرقابل پیش‌بینی در نظر گرفته می‌شود.
توصیه می شود که در مقابل این گزینه چند نقطه چین، همراه با عبارت “ذکر شود” گنجانده شود. به آمارگیر نیز آموزش داده شود که به هنگام برخورد با چنین مواردی، جزییات آن را یادداشت نماید تا در صورتی که تعداد پاسخ های “سایر” از حد انتظار بیشتر شود، بتوان آن را تفکیک نموده و موارد مهم را با کد جداگانه‌ای نشان داد. برای مثال وقتی که در مورد علت ترک تحصیل پاسخگویی سوال می‌شود، گزینه‌های:
عدم علاقه……. تمام تحصیل…… فقرمالی…… پیدا کردن شغل خوب…… ازدواج…… قبول نشدن در کنکور ………
قابل پیش‌بینی و مشخص می‌باشند. ولی دلایل بسیار زیاد دیگری هم ممکن است وجود داشته باشند که از دید و نظر محقق بدور مانده باشند و یا فراوانی کمتری نسبت به موارد فوق داشته باشند که همه اینها باید تحت عنوان “سایر با ذکر مورد……. ” آورده شود پس از جمع‌آوری داده‌ها، ممکن است پاسخی مثل “رفتن به سربازی” یا “شرکت در جبهه” نیز از موارد متعدد و فراوانی باشد که جواب پاسخگویان را تشکیل داده باشد. بطوری که فراوانی آنها از حداقل فراوانی موارد از قبل مشخص شده بیشتر باشد. در این صورت باید برای آنها کد جداگانه‌ای در نظر گرفت و آنها را تفکیک نمود.
بدیهی است تفکیک موارد “اظهار نشده و نمی‌دانم ” که تحت همان کد “۹ یا ۹۹” برای “موارد جواب داده نشده” می‌باشد، از سایر موارد الزامی است.
•نکته دیگری که در کدگذاری جواب پاسخگویان بایستی مدنظر قرار گیرد، رعایت ترتیب منطقی برای داده‌های ترتیبی است. مثلاً وقتی که درباره شدت بیماری یا درد از بیماری سوال می‌شود اختصاص کد:
۰= ندارد ۱=خفیف ۲= متوسط، ۳= شدید
مناسب می باشد لیکن در نظر گرفتن همین کدها به صورت:
۱= ندارد ۳= خفیف ، ۲= متوسط ۰= شدید
نامناسب می باشد، زیرا هم پاسخگو و هم پرسشگر را گمراه کرده و دچار اشتباه خواهد کرد.
•ترتیب نوشتن کدها در پرسشنامه نیز باید روند مرتبی داشته باشد و از کوچک به بزرگ و یا از بزرگ به کوچک نوشته شود. از نامرتب نوشتن و هم ریختگی آنها خودداری شود تا از ارتکاب اشتباه و خطا در مراحل بعدی اجتناب شده و یا زمینه آن را کاهش دهد. مثلاً
۰= مجرد ۱= متاهل، ۲= مطلقه ۳ = همسر مرده
مناسب می باشد. لیکن در نظر گرفتن همین کدها برای همان گزینه‌ها با روند نامرتب (جابجا نوشتن محل کدها):
۱=متاهل ۰= مجرد، ۳= همسر مرده، ۲= مطلقه
نامطلوب خواهد بود.
•کدها حتی‌المقدور باید استاندارد باشند. بدین معنا که در همه سوالات به پاسخ “خیر” کد “.” و به پاسخ های نامعلوم کد “۹” و … اختصاص داده شود. بنابراین نباید در یک سوال پاسخ “خیر” با کد ۰ و در سوال دیگر با کد ۱ نشان داده شود.
•از طرف دیگر، باید دقت نمود که کدگذاری داده‌های کمی (چه به صورت گسسته و چه به صورت پیوسته) صحیح نمی‌باشد و نباید جواب پاسخگو را به عنوان کد در نظر گرفت. حتی توصیه می‌شود که جواب پاسخگو به صورت دسته‌بندی ثبت نشود. مثلا نوشتن سن پاسخگو در یکی از دسته‌های:
بیشتر از ۸۰، …. ۸۰-۷۰، ….. ۰۰۰۰ ،……. ۳۰-۴۰ ،….. ۳۰-۲۰، …… ۲۰-،۱۰………
هر چند می‌‌تواند درست باشد ولی اصلا توصیه نمی‌شود. زیرا موجب از دست رفتن پاره ای از اطلاعات می‌شود. بنابراین بایستی اصل عدد و اندازه کمی را یادداشت نمود. هر چند در مراحل بعدی و به هنگام استخراج جدول، دسته‌بندی پاسخ‌های دریافتی ضروری می‌باشد که توضیح بیشتر آن از حوصله این کتاب خارج است. (۳)
•اگر تعداد کدهای سوالی بیش از ۱۰ مورد باشد، استفاده از کد دو رقمی ضروری است در این صورت استفاده از کدهای ۱۱ تا ۹۹ توصیه می شود. زیرا در صورت استفاده از کدهای ۱و ۲ و … و ۹۹، بایستی بهصورت ۱۰ و ۰۲ و … و ۹۹ نوشته شوند. اما چون نوشتن صفر در سمت راست اعداد، از نظر ریاضی بی‌معنا است، ممکن است برای پرسشگر یا کدگذار چنین تداعی شود که نوشتن صفر در سمت راست کدها معنایی ندارد و اهمال آنان را در پی داشته باشد. در نتیجه به هنگام ورود داده‌ها به کامپیوتر نیز موجب بروز اشتباه و خطا شود.
•در نوشتن تاریخ‌های مورد پرسش نیز باید صفرهای لازم سمت راست اعداد احتماً نوشته شود. مثلاً تاریخ “نهم شهریور هفتاد” را به صورت شش رقمی نوشته
۷ ۰ ۰ ۶ ۰ ۹
شود و از ثبت آن به صورت
۷ ۰ ۶ ۹
یا

۷

۰

 

۶

 

۹

پرهیز شود.
•در انجام کدگذاری توصیه می شود که هر پرسشنامه را به منزله یک واحد کامل در نظر گرفته و کدگذاری آن را کاملاً تمام نموده و سپس به سراغ کدگذاری پرسشنامه بعدی رفت (در مقایسه با کدگذاری سوال به سوال، یعنی ابتدا سوال اول همه پرسشنامه ها، بعد سوال دوم همه پرسشنامه‌ها و…) این کار ناسازگارهای هر پرسشنامه را بهتر نمایان می سازد و در وقت نیز صرفه‌جویی می شود.
البته در بعضی اوقات به دلیل سنگین بودن کدگذاری ممکن است کدگذاری یک سوال خاص یا مجموعه‌ای‌ از سوالات خاص وابسته به هم، مثل طبقه اجتماعی- اقتصادی افراد مورد بررسی را به شخصی کاملا آشنا و متخصص واگذار نمود و از او خواست که فقط همان سوال یا مجموعه سوالات را کدگذاری نماید. صرفه‌جویی در وقت و هزینه، افرایش دقت و هماهنگی بین کدها و کاهش خطا و اشتباهات می‌تواند توجیه منطقی این کار باشد.
•تعریف متغیرها و کدها در برنامه‌نویسی کامپیوتر باید بگونه‌ای باشد که برای کدهای استفاده شده دامنه‌ای را تعریف نمود تا چنانچه در هنگام ورود داده‌ها، کدی خارج از این دامنه وارد کامپیوتر شود کامپیوتر از پذیرش آن خودداری نموده و با صدای “بیپ- بیپ” به وارد کننده کد هشدار دهد. این عمل احتمال اشتباه را به طور چشمگیری کاهش می‌دهد. برای مثال، درکدگذاری گزینه‌های مربوط به وضعیت تاهل، می‌توان کدهای ۰، ۱، ۲، ۳ ، و ۹ به ترتیب برای گزینه‌های مجرد، متاهل، مطلقه، همسر مرده و نامعلوم اختصاص داد و این کدها را به صورت انحصاری برای نرم‌افزار مورد استفاده تعریف کرد. در این صورت، هر کد دیگری (به غیر از کدهای ۰، ۱، ۲، ۳، و ۹) وارد شود، کامیپوتر یا با تولید صدای ” بیپ- بیپ ” اپراتور را از اشتباه خود آگاه می‌سازد یا به هنگام نمایش در مونیتور، برچسب (lABEL) آنها را نشان نداده و فقط کد وارد شده‌ی اشتباه را نشان می دهد.
•سوالات باز حتماً باید قبل از ورود به کامپیوتر کدگذاری شوند. بدین منظور ابتدا باید کلیه پاسخ‌های هر سوال باز را مطالعه نموده و گزینه‌های قابل کدگذاری را استخراج نمود تا کدگذاری سوال باز جامع و فراگیر باشد.
•درکدگذاری باید همواره حداکثر صرفه‌جویی را اعمال نمود. برای مثال اگر به هنگام کدگذاری تاریخ‌های مورد نیاز، دانستن تاریخ روز ضرورتی ندارد، در کدگذاری آن اصرار نورزید. هر چند ممکن است تاریخ روز پرسیده و جمع‌آوری شده باشد. همین طور است در کد گذاری” سال واقعه مورد بحث”، تنها دو رقم سمت راست را کدگذاری کنید و نیازی به دو رقم سمت چپ آن یعنی “۱۳” وجود ندارد. برای توجیه بیشتر، یک بررسی شامل ۵۰۰۰ واحد نمونه را در نظر بگیرید که در ۴ مورد، تاریخ وقایع مختلف سوال شده است. تنها با حذف دو رقم سمت چپ آن یعنی “۱۳” ، فقط ۴۰۰۰۰ بابت در حافظه کامپیوتر صرفه‌جویی خواهد شد.
•وقتی سوالی دارای جواب منحر به فرد نباشد، پاسخگو ممکن است بیشتر از یک جواب را برگزیند. مثلا برای پاسخ به این سوال که امروز کدام روزنامه را خوانده‌اید؟ گزینه های زیر مشخص شده باشد:
اطلاعات (۱)، کیهان (۲)، اقتصاد (۳)، همشهری (۴)، ایران (۵)
خواننده می‌تواند چند انتخاب داشته باشد. به منظور کدگذاری چنین حالاتی دو راه وجود دارد:
۱- اول این که تعداد گزینه های مشخص شده در پاسخ سوال (در این مثال ۵ گزینه) ستون در نظر گرفت و هر کدام از ستون‌ها را به روزنامه‌ای اختصاص داد. اگر خواننده روزنامه‌ای را خوانده باشد، کد ۱ و در غیر این صورت کد ۰ را برای آن روزنامه خواهید نوشت. بدین ترتیب به تعداد روزنامه‌ها، ستون وجود دارد که با کد ۰ یا کد ۱ پرمی شود. در

۰

۰

۰

۰

۰

۰

برای کسی که هیچ کدام از روزنامه‌های فوق را نخوانده است، و کد برای کسی که همه روزنامه‌های فوق را

۱

۱

۱

۱

۱

۱

و کد برای کسی که فقط روزنامه های

۰

۰

۱

۱

۰

۰

هم را خوانده است در ۵ ستون مربوطه ثبت خواهد شد.
۲- اختصاص کدهای ۰ و ۱ و ۲ و ۳ و ۸ و ۱۶ (۴) (توان‌های صحیح ۲) به هر روزنامه به صورت:
هیچ کدام (۰)، اطلاعات (۱)، کیهان (۲) اقتصاد (۴) همشهری (۸)، ایران (۱۶) می باشد آنگاه دو رقم برای کدگذاری آن باید در نظر گرفت و مجموع کدروزنامه‌های انتخاب شده را در آن وارد نمود. مثلاً کسی که همه روزنامه‌ها را خوانده است که:
۱+۲+۴+۸+۱۶=۳۱
و کسی که روزنامه های اطلاعات، اقتصاد و همشهری را خوانده است کد:
۱+۴+۸=۱۳
و کسی که روزنامه های اقتصاد و ایران را خوانده است کد:
۴+۱۶=۲۰
را در ستون های مربوطه وارد می‌کنیم.
روش اول بسیار ساده‌تر و بدون اشتباه است، اما باید ستون‌های بیشتری (به تعداد روزنامه‌ها) برای ورود اطلاعات به کامپیوتر در نظر گرفت. در حالی که علی‌رغم کمتر جا گرفتن روش دوم، احتمال اشتباه در محاسبه ترکیبات مختلف وجود دارد.

پی‌نوشت‌ها:

برخی معتقدند که کدگذاری داده‌ها، مرحله مجزایی از جمع‌آوری داده‌ها می‌باشد . لیکن چون کدگذاری داده‌ها می تواند و باید همراه با جمع‌آوری داده‌ها و یا حتی در پرسشنامه‌های از قبل کد بندی شده، قبل از این مرحله شروع شود و تا پس از آن ادامه دارد، نگارنده معتقد است که نمی توان آن را از مرحله جمع‌آوری داده‌ها تفکیک نمود.
۲- کد ۹ یا ۹۹را برای داده‌های گمشده نیز در نظر می‌گیرند.
۳- اطلاعات بیشتری درباره دسته‌بندی اطلاعات را می‌توان در کتاب آمارحیاتی کاربردی از همین نگارنده مطالعه نمود.
۴- به منظور احتمال از بین بردن احتمال یکسان شدن ترکیبات مختلف با یکدیگر کدهای ۱و۲و۴ و ۸ و ۱۶ اختصاص داده شده است تا مجموع ترکیبات مختلف، نتایج مختلفی را بدهند. در این شیوه کدگذاری باید کد ۰ به هیچ کدام یعنی کسی که اصلاً روزنامه نمی‌خواند، اختصاص یابد.

منبع مقاله :
صانعی، دکتر سید حسن؛ (۱۳۸۸)، فنون تحقیق: پرسشنامه، تهران: انتشارات اندیشمند، چاپ اول.

 لینک منبع

اشتراک گذاری مطلب

انتشار مطالب با ذکر منبع مجاز می باشد.