جامعة الملك سعود – المملكة العربية السعودية

Slides:



Advertisements
Similar presentations
Data, Tables and Graphs Presentation. Types of data Qualitative and quantitative Qualitative is descriptive (nominal, categories), labels or words Quantitative.
Advertisements

By Hui Bian Office for Faculty Excellence Spring
Descriptive Statistics. Descriptive Statistics: Summarizing your data and getting an overview of the dataset  Why do you want to start with Descriptive.
1 NURS/HSCI 597 Frequency Distribution Heibatollah Baghi, and Mastee Badii.
17a.Accessing Data: Manipulating Variables in SPSS ®
Introduction to SPSS Allen Risley Academic Technology Services, CSUSM
SPSS Introductory Workshop Humboldt State University May 6, /6/2011www.ssric.org.
1 SPSS Recently it has gone through a name change so your icon on your computer may be under a different name (i.e. PASW- Predictive Analytics SoftWare).
A Simple Guide to Using SPSS© for Windows
SOC 3155 SPSS CODING/GRAPHS & CHARTS CENTRAL TENDENCY & DISPERSION.
Introduction to SPSS Descriptive Statistics. Introduction to SPSS Statistics Program for the Social Sciences (SPSS) Commonly used statistical software.
Quantitative Data Analysis Definitions Examples of a data set Creating a data set Displaying and presenting data – frequency distributions Grouping and.
Data Transformations COMPUTE and RECODE Commands.
Introduction to SPSS Short Courses Last created (Feb, 2008) Kentaka Aruga.
Re-Expressing Variables
Mann-Whitney and Wilcoxon Tests.
Introduction to SPSS (For SPSS Version 16.0)
DEVELOPING A CODING SCHEME AND SETTING UP YOUR SPSS DATA FILE
CLV 2 Lab Richard MICHON Ted Rogers School of Management Ryerson University, Toronto.
How to Analyze Data? Aravinda Guntupalli. SPSS windows process Data window Variable view window Output window Chart editor window.
SW388R7 Data Analysis & Computers II Slide 1 Assumption of Homoscedasticity Homoscedasticity (aka homogeneity or uniformity of variance) Transformations.
1 Road Crash and Victim Information System (RCVIS) Mr Sem Panhavuth Road Crash and victim information System Project Manager Handicap International Belgium.
LINDSEY BREWER CSSCR (CENTER FOR SOCIAL SCIENCE COMPUTATION AND RESEARCH) UNIVERSITY OF WASHINGTON September 17, 2009 Introduction to SPSS (Version 16)
Using SPSS for Windows Part II Jie Chen Ph.D. Phone: /6/20151.
Chapter 11 Descriptive Statistics Gay, Mills, and Airasian
Data Analysis Lab 02 Using Crosstabs to compare percentages.
Rational Expressions – Sum & Difference 1 When fractions already have a common denominator, keep the denominator the same and add / subtract your numerators.
Work with Variables Section 5. Add a variable Click on the top grey portion of the GPA column to highlight the column. At the top left of your screen,
Social Science Research Design and Statistics, 2/e Alfred P. Rovai, Jason D. Baker, and Michael K. Ponton Recoding Variables PowerPoint Prepared by Alfred.
Introduction to Quantitative Research Analysis and SPSS SW242 – Session 6 Slides.
SOC 3155 SPSS CODING/GRAPHS & CHARTS CENTRAL TENDENCY & DISPERSION h458 student
Dr. Engr. Sami ur Rahman Research Methods in Computer Science Lecture: Data Analysis (Introduction to SPSS)
SW318 Social Work Statistics Slide 1 Percentile Practice Problem (1) This question asks you to use percentile for the variable [marital]. Recall that the.
SW388R6 Data Analysis and Computers I Slide 1 Percentiles and Standard Scores Sample Percentile Homework Problem Solving the Percentile Problem with SPSS.
Mr. Magdi Morsi Statistician Department of Research and Studies, MOH
Data Lab # 4 June 16, 2008 Ivan Katchanovski, Ph.D. POL 242Y-Y.
Understanding SPSS Brandon Aragon, Research Technician Eric Cazares, Graduate Assistant Claudia Alvarado, Graduate Assistant Workshop Series October.
Chapter 3: Organizing Data. Raw data is useless to us unless we can meaningfully organize and summarize it (descriptive statistics). Organization techniques.
DTC Quantitative Methods Summary of some SPSS commands Weeks 1 & 2, January 2012.
SW388R7 Data Analysis & Computers II Slide 1 Incorporating Nonmetric Data with Dummy Variables The logic of dummy-coding Dummy-coding in SPSS.
Descriptive Statistics Research Writing Aiden Yeh, PhD.
Use SPSS for solving the problems Lecture#21. Opening SPSS The default window will have the data editor There are two sheets in the window: 1. Data view2.
Entering Data in SPSS Open SPSS. Select the radio button beside ‘type in data’. Click OK. At the bottom of the SPSS spreadsheet, select variable view.
Analyzing Data. Learning Objectives You will learn to: – Import from excel – Add, move, recode, label, and compute variables – Perform descriptive analyses.
SOC 305, Southeastern Louisiana University Prof. Robert Martin.
Educational Research Descriptive Statistics Chapter th edition Chapter th edition Gay and Airasian.
SOC 3155 SPSS CODING/GRAPHS & CHARTS CENTRAL TENDENCY & DISPERSION h458 student
Setting up your database And codebook. What is a codebook? It is a description of all your variables How they were created How they are scored Includes.
Workshop Series May 17, 2017 Brandon Aragon
Introduction to SPSS Asst. Prof. Dr. Emrah Oney.
Statistical Analysis – Part 3
Statistics in SPSS Lecture 3
Introduction to Marketing Research
Introduction to SPSS July 28, :00-4:00 pm 112A Stright Hall
SPSS CODING/GRAPHS & CHARTS CENTRAL TENDENCY & DISPERSION
Dr. Siti Nor Binti Yaacob
Introduction to SPSS.
Dr. Siti Nor Binti Yaacob
LINDSEY BREWER CSSCR (CENTER FOR SOCIAL SCIENCE COMPUTATION AND RESEARCH) UNIVERSITY OF WASHINGTON September 17, 2009 Introduction to SPSS (Version 16)
SPSS STATISTICAL PACKAGE FOR SOCIAL SCIENCES
Central Tendency of Distributions (Mean, Median, Mode)
Spss.
SPSS Intro and Analysis
Georgi Iskrov, MBA, MPH, PhD Department of Social Medicine
SPSS tips and tricks for the initiated
Distributions, Percentiles, and Central Tendency
Measures of Central Tendency
By A.Arul Xavier Department of mathematics
Data, Tables and Graphs Presentation.
Distributive Property
Presentation transcript:

جامعة الملك سعود – المملكة العربية السعودية تحويل البيانات جامعة الملك سعود – المملكة العربية السعودية

التحويلات Transformations قبل معالجة البيانات احصائيا يجب التأكد من بعض خصائص البيانات حتى يمكن اختيار الأسلوب المناسب للتعامل معها. من المعروف ان التحليل الاحصائى للبيانات يعتمد اساسا على مجموعة من الاختبارات الاحصائية، ويمكن بصفه عامه تقسيم هذه الاختبارات الى نوعين أساسيين هما: الاختبارات المعلميةParametric Tests الاختبارات اللامعلميه Non-Parametric Tests حيث يفضل التعامل مع الاختبارات المعلميه اذا كانت شروطها مستوفاه لأنها أقوى. فمن أحد الشروط الهامه التى تعتمد عليها أغلب الاختبارات المعلميه هى أن تكون البيانات لها التوزيع الطبيعىNormal Distribution . اذا لم يتحقق هذا الشرط فبتطبيق الاختبارات المعلمية تكون النتائج خاطئة وغير مجديه وكثيرا من مستخدمى الحزمة لا يلتفتون لهذا الفرض مما يؤدى لنتائج وتفسيرات خاطئة. اذا لم يتحقق هذا الفرض فيمكن أن نلجأ لأحدى الطريقتين: تحويل البيانات التى لا تتوزع طبيعيا لبيانات طبيعية عن طريقة قائمة Transform استخدام اختبار لا يعتمد على هذا الشرط باستبدال الاختبار المعلمى باحد الاختبارات اللامعلمية.

ايضا من اسباب استخدام قائمة Transform هو ان التعامل مع البيانات اللفظيه يكون صعب ومكلف فيمكن التغلب على ذلك بتكويد (ترميز) البيانات عن طريق قائمة Transform لذا فاننا سوف نتعامل فى هذا الدرس مع القائمة Transform لما لها من أهمية. قائمة Transform سوف نهتم فى هذا الدرس بكيفية اجراء بعض العمليات وذلك باستخدام قائمة Transform وتللك العمليات هى: انشاء متغير جديد الترميز احلال ( استبدال) القيم المفقوده بقيم اخرى ترتيب الحالات انشاء سلسله زمنيه عد الحالات التى تحتوى على قيم معينه

3-1 انشاء متغيرات جديده Create New variables يمكن انشاء متغيرات جديده باستخدام المتغيرات الموجوده فى الملف النشط عن طريق بفتح الملفdata4.sav من قائمة Transform نختار Compute

3- تظهر شاشة جديده بعنوان Compute Variable: تنقسم الى عدة اجزاء هى اسم المتغير الجديد مستطيل التعبير الرياضى 3- تظهر شاشة جديده بعنوان Compute Variable: تنقسم الى عدة اجزاء هى اسم المتغير الجديد مستطيل التعبير الرياضى المستخدم لحساب قيمة المتغير الجديد الآله الحاسبة مستطيل الدوال الاله الحاسبه مستطيل الدوال المتغيرات الموجودة بالملف الشرط اللازم توافره لاجراء العمليه

(أ) إنشاء متغير جديد بدون قيد اذا اردنا حساب الدخل السنوى لجميع الأشخاص فى الملف data4.sav نكتب اسم المتغير الجديد وليكن incomey ونضغط على Type and Label ونحدد النوع ونكتب income in year فى خانة Label ونختار continue ثم ننقل المتغير income فى خانة Numeric expression وباستخدام الآله الحاسبة نضرب المتغير فى الرقم12 وهو عدد شهور السنة ثم نضغط Ok سوف نعود للملف data4.sav وقد اضاف متغير جديدincomey يحتوى على قيم income السنويه

الدخل الشهرى الدخل السنوى

(ب) إنشاء متغير جديد باستخدام شرط اذا اردنا حساب الدخل السنوى لجميع الأشخاص فى الملفdata4.sav والذين لديهم أقل من طفلين ننفذ نفس الخطوات السابقة مع اختلاف اننا سوف نكتب اسم المتغير الجديد وليكن incomey2 وسوف نحدد الشرط الذى ينطبق على الحالات التى سينفذ عليها التعبير الحسابى بالضغط على خانة If

سوف تظهر شاشة جديده بعنوان Compute variable: If Cases نجد أن include all cases هى المحدده فنختارInclude if Case satisfies condition ثم نحدد الشرط ونظغط Continue

نعود للشاشه السابقه ثم نضعط Ok فنعود للملف data4.sav

لاحظ تلك الأعمده

فيمكن استخدام الأمر Compute لتنفيذ كثيرا من العمليات وبنفس الطريقة السابقة.

3-2 الترميز Recode (أ) دمج بيانات كثيرة لمتغير مستمر فى كثير من الاحيان قد نحتاج الى عمليه التكويد ( الترميز) وذلك بتعديل قيم البيانات وتغيرها من بيانات لفظيه الى بيانات كميه بغرض تسهيل التعامل معها وبذلك نخصص مساحة اقل لتخزينها فى ذاكرة الحاسب المؤقته. واحيانا يتم تكويد البيانات الرقميه المستمره لسهوله عرضها والتعامل معها ويمكن تكويد البيانات فى الحالات التاليه: (أ) دمج بيانات كثيرة لمتغير مستمر اذا كان لدينا درجات 70 طالب فى احد المواد كالاتى: 0, 25, 5, 40, 17, 29, 14, 38, 15, 10, 11, 35, 13, 18, 9, 34, 16, 19, 21, 7, 13, 11, 34, 35, 23, 18, 16, 18, 24, 22, 14, 24, 13, 16, 25, 25, 19, 20 23, 26, 27, 28, 30, 13, 17, 15, 25, 26, 27, 21, 26, 29, 31, 32, 30, 32, 31, 34, 9, 8,7, 8, 23,6, 5, 2, 5, 12, 15, 17. ونريد تلخيص هذه البيانات فى جدول تكرارى مكون من اربعة فئات0- , 10- , 20- , 30-40 فتسمى عمليه جدوله البيانات المستمرة بالتكويد.

بوضع البيانات فى ملف data5.sav باسم المتغير X من قائمة Transform نحتار Recode يظهر اختيارين هما (i) Into the same Variables: وهى استبدال القيم الحالية بالقيم الجديده بعد التكويد (ii) Into Different Variables: وهى وضع القيم الجديده تحت متغير جديد والحفاظ على المتغير الأصلى 3. بالنقر على الاختيار الثانىinto different Variables سوف تظهر شاشة جديدة بعنوان Recode into Different Variables وننقل المتغير X

4. نحدد اسم المتغير الجديد فى خانة Output Variable ونحدد label ان وجد ثم نضغط علىChange

5. ثم نضغط على Old and New Values فتظهر الشاشة التالية الاختيار الأول Values تستخدم اذا اردنا تكويد متغير لفظى الاختيار الثانى Range تستخدم اذا اردنا تكويد متغير عددى مستمر 6. فباختيار Range يتم تنشيط خانتى Range فى قائمة Old Value 7. فنكتب بداية ونهاية الفتره (المدى) 8. فى قائمة New Value نختار Value ونكتب بها مركز الفئة ( منتصف الفترة) ثم نختار Add لكى تستبدل القيم التى تقع فى هذه الفترة بمركز الفترة. 9. ثم نكرر هذه العملية لكل الفئات (الفترات) الموجودة

10. ثم نختار Continue نعود للشاشة السابقة (لاحظ الاختيارIf ) 11 10. ثم نختار Continue نعود للشاشة السابقة (لاحظ الاختيارIf ) 11. نضغط علىChange لتنفيذ عملية التكويد 12. ثم نختار Ok فنعود للملف data5.sav وقد تم إنشأ متغير جديد يحتوى على مراكز الفئات التى يقع فيها العنصر المقابل للمتغير الأصلى

(ب) تكويد متغير لفظى الى متغير رقمى بفتح الملف data2.sav ونرغب فى تكويد النوع gender الى الرقمين 0, 1 حيث 0 تعنى female وايضا 1 تعنى male من قائمة Transform نختارRecode ثم نختار into Different Variable ثم ننقل المتغير gender ونكتب فى خانةOutput Variable الأسم الجديد وليكن gender1

6. ونكتب فى خانة New Value القيمة 0 ثم نضغط Add وهكذا مع Male 5. ثم نضغط على Old and New Value من قائمة Old Value نختار Value ثم نكتب Female 6. ونكتب فى خانة New Value القيمة 0 ثم نضغط Add وهكذا مع Male 7. ثم نختار Continue 8. نعود للشاشة السابقة نختارChange ثم نضغطOk نعود للملف data2.sav وينشا متغير جديد gender1 محتواه 0,1

(ج) التكويد الاتوماتيكى 1- بفتح الملف data4.sav 2- من قائمة Transform نختار Automatic Recode 3- تظهر شاشة جديدة نحدد فيها المتغير المراد تكويده وليكن Gender واسم المتغير الجديدgender1 4- ثم نضغط Add new Variable لكى يضيف المتغير gender1 لملف البيانات data4.sav ويحدد قيمه 5- ثم نضغط على Ok

6- سوف يعود للملفdata4.sav وقد قام بتكويد البيانات تبعا للنوع حيث الرقم 1 يناظر female والرقم 2 يناظر Male

3-3 استبدال القيم المفقوده بقيم اخرى Replacing Missing Values عند التعامل مع القيم المفقوده احصائيا عن طريق حزمة SPSS سوف تتعامل معها على انها غير موجوده ولن تؤخذ فى الاعتبار عند العرض والتحليل. فأحيانا نرغب فى وضع قيما تقديريه للقيم المفقودة وبذلك تؤخذ فى الاعتبار عند المعالجة الاحصائية. وتوجد عدة طرق احصائية تستخدم لتحديد القيم المفقوده واستبدالها عن طريق وسط العينه أو وسط القيم المجاوره وسيط العينة أو وسيط القيم المجاوره الاستكمال الخطى حيث تستخدم القيم القبليه والبعديه للقيم المفقوده فى تقدير القيم المفقوده استخدام معادلة الخط للعينه فى تقدير القيم المفقوده اذا كان لدينا ملف data4.sav ويحتوى متغير الدخل على قيم مفقودة وهى القيم المحصورة بين 1000-2000 ونريد استبدالها

(أ) استبدال القيم المفقوده بقيمة محدده ( وليكن 400) من قائمة Transform نختار Recode نختار Into Same Variable ننقل المتغير الى قائمة Variable نضغط على Old and New Values فى مربع Old Value نختارSystem – or user missing فى مربع New Value نكتب القيمة المراد التى تستبدل بها القيم المفقوده نضغط Add ثم Continue ثم نختار Ok

لقد تم استبدال جميع القيم التى تقع فى الفترة 1000-2000 والتى تعتبر قيم مفقوده بالقيمة 400

(ب) استبدال القيم المفقوده باستخدام بعض الدوال الاحصائيه من قائمة Transform نختارReplacing Missing Values تظهر شاشه جديده نحدد الطريقة التى ستستبدل بها القيم المفقوده من Method وليكن Series Mean ثم ننقل المتغير Income نحدد اسم المتغير الجديد وليكن Income_m نختار Change ثم Ok المتغيرات العدد فقط العمليات المتاحه

سوف نعود للملف data4.sav وقد اضاف متغير جديد بالعنوان الذى حددناه income_m واستبدل جميع القيم المفقودة والموجودة فى المدى 1000-2000 بمتوسط العينة

3-4 الترتيب Ranking فى كثير من طرق العرض والتحليل الاحصائى قد نرغب فى التعامل مع الرتب الخاصة بالمتغير وليست قيم المتغير. فاذا كان لدينا ملفdata4.sav ونريد رتب كلا من الدخل وعدد الاطفال.

من قائمة Transform نختار Rank Cases ننقل المتغيرات المراد ترتيبها الى قائمة Variable(s) نحدد نوع الترتيب تصاعدى او تنازلى من قائمةAssign Rank 1 to ونحدد طبيعية الترتيب من الاختيار Rank Types نحدد نوع العمليه التى تستخدم عند تساوى قيمتين من الاختيار Ties ثم نختار Ok

3-5 انشاء سلسلة Create Time Series يمكن لحزمة SPSS انشاء متغير جديد وتحديد قيم لهذا المتغير عن طريق الأمر Function الموجود فى الأمر الفرعى Create Time Series وذلك بطريقه يحددها المستخدم. 1- بفتح الملف data4.sav

2- من قائمة Transform نختار Create Time Series 4- يمكن تقسيم الشاشة لعدة اجزاء الدوالFunction التى يمكن استخدامها مع السلاسل الزمنيه المتغيرات الموجوده فى الملف النشط اسم المتغير الجديدName مستطيل New Variables ويحدد به العمليه التى ستجرى على المتغير الحالى للحصول على المتغير الجديد

اذا كنا نريد حساب المجاميع التراكمية للدخل سنتبع التالى: نختار من الدوالFunction الداله Cumulative Sum ننقل المتغيرincome الى قائمة New Variables نكتب اسم المتغير الذى ستظهر به النتائج Cum_income فى خانة Name ثم نضغط Change نضغطOk

القيم المفقودة لم تدخل ضمن العملية التى تم اجرائها على المتغير Income لكن لو اعدنا ما تم لكن باختيار المتغير income_m سوف تدخل جميع القيم ضمن العمليه بسبب عمليه استبدال القيم المفقودة بوسط العينة سابقا.

3-6 حصر الحالات Count فى بعض الاحيان قد نرغب فى حصر (تعين عدد) الحالات التى تساوى قيمة معينة أو التى تقع فى مدى معين أو غير ذلك لذا سوف نستخدم الاختيار Count من قائمةTransform بفتح الملفdata4.sav من قائمة Transform نختار Count تظهر شاشة جديدة بعنوانCount Occurrences of Values within Cases

ننقل المتغير المراد تنفيذ عملية العد عليه فى خانة Variables ونكتب الاسم المتغير الذى سيحتوى القيم الجديد للحالات وهى 1 او 0 حيث 1 تعنى ان الحاله تعد معنا و0 تعنى ان الحاله لا تعد معنا نختار Define Values تظهر شاشة بعنوان Count Values within cases: Values to Count تحتوى على عدة خيارات

Value: تستخدم لعد الحالات التى تحتوى على قيم مساويه لقيمة معينه Range: تستخدم لعد الحالات التى تقع فى مدى معين Range: Lowest through تستخدم لعد الحالات التى تحتوى على قيم اقل من قيمة معينه Range: through highest تستخدم لعد الحالات التى تحتوى على قيم ااكبر من قيمة معينه وغير ذلك من الاختيارات الاخرى.

نختار المدى وليكن 200-400 ثم نختار Add نختار Continue نعود للشاشه السابقه فنحدد Label الخاص بالمتغير الجديد ثم نضغط Ok سوف نعود للملف data4.sav

ونلاحظ ان الحالات التى تقع فى المدى المحدد سوف يقابلها القيمة 1 فى المتغير الجديد numb_incom والحالات الى لا تقع فى هذا المدى يقابلها الرقم صفر وبعد عدد الخانات التى تحتوى الواحد او ايجاد مجموع عناصر المتغيرnumb_incom نحصل على عدد الحالات فى المتغير income_m والتى تقع فى المدى من 200 الى 400