본문 바로가기

공부기록/대학원

[통계] SPSS 기초 7-17강 요약

반응형

*출처 : 논문쓰는남자 <논쓰남> 

 

7. 데이터 클리닝

정확한 분석을 위한 전처리 (결측값 이상치 정규성 검정)

1) 결측값 [변수보기] - [...] - 이산형 결측값은 최대 3개 설정, 그 이상 결측 처리 원하면 범위

- 미입력 데이터는 spss 프로그램 내에서 자동처리

2) 이상치 [분석] - [데이터탐색] - [종속변수] / 상자도표를 넘어선 수치 (*는 극단적 이상치. 삭제 요함)

- 가장 높은 극단적 이상치를 하나씩 삭제해가면서 확인 후 이상치 사라지면 종료

3) 정규성 검정 : 정규성을 만족했는가 (모수검정, t검정, anova 등)

- 표본의 개수가 30개 미만인 경우 정규성 검정 실시. 중심극한정리 기준 30이기 때문

- 30개 이상이면 바로 모수검정 실시 가능

- 단, 집단 간 비교 분석할 때는 각각의 집단이 30개 이상이어야 함 (집단간 비율 중요)

- [분석] - [기술통계] - [데이터탐색] - [도표] - 검정과함께도표 체크 - 정규성검정 (둘 중 하나라도 유의하면 유의하다)

 

8. 변수 계산 / 사칙연산

[변환] - 변수 계산 - 목표변수(새로운 변수명) / 숫자표현식(수식)

리커트 척도(문항 수 많은 경우)

- 변수 이름에 숫자 넣어서 규칙성 만들기

- sum(만족도_1 to 만족도_6) / mean(A to B) *to 사용하고 싶으면 변수명 규칙성 필수

 

9. 파일분할 

: 집단(그룹) 별로 나누어 결과값을 보고자 할 때 사용하는 기능

[데이터] - [파일분할] - [각 집단별로 출력결과를 나타냄]

- 파일분할에 들어갈 수 있는 변수는 명목척도

- 표본의 수가 충분

- 파일 분할 기능이 더 이상 필요 없으면 비활성화 [파일분할] - [재설정] - [확인]

*집단들 비교, 집단별 비교 표현의 차이만 다름 

 

10. 더미변수(가변수)

질적 변수(명목척도) > 0, 1 > 양적변수

- 질적 변수 응답범주가 k 개 일 때 더미변수 개수는 k-1 개 (ex. 성별 변수 응답범주 2개, 더미변수 2-1=1개)

- [변환] - [다른 이름으로 코딩변경] 여성 1, 남성 0 

- [변환] - [더미변수 작성] - [다음에 대한 더미변수 작성] + 참조항목 변수 삭제

 

11. 버전 27

상관분석 : 하한 삼각형만 표시 기능 on 

효과크기 

 

12. if함수

파일 - 새파일 - 명령문 : if(성별=1 and 나이>=20) 만족=1. ('만족'변수는 숫자 1로 표현해줘.) - excute.

 

13. 빈도분석

N개수를 파악하는 분석

[분석] - [기술통계량] - [빈도분석] *유효퍼센트는 결측값 제외로 100% 표기 (논문기재용)

누적퍼센트 : 숫자변수를 범주화하여 집단범주

 

14. 기술통계

- 연속형 변에 적합. 최댓값 최솟값, 평균, 표준편차

- [분석] - [기술통계량] - [기술통계] 

 

15. 기초기능

- [최근 사용한 대화 상자 다시 호출] 

- 분석표 소수점 자리 수정하기 : 표 더블 클릭 후 셀 드래그 - 셀 특성 - 형식값 - 소수점이하자리

- 분석 결과 > 엑셀로 : 결과 복사(마우스로) 후 붙여넣기

 

16. 척도

*질적척도

명목척도 : 범주형, 문자 ex. 성별 / 상호배타성, 총망라성 필수

서열척도 : 순위화, 서열화 ex. 가장 선호하는 브랜드를 순위별로 선택하시오 

*양적척도

등간척도 : 척도간 값이 동등, 절대적 '0' 없음

비율척도 : 숫자, 절대적 0 존재, 사칙연산 가능

(참고. 선형회귀분석 (독립/연속 - 종속/연속))

 

17. 변수와 척도

변수 : 연구하고자 하는 개념, 설문조사를 통해 연구자가 알고 싶은 개념 (성별, 거주지역, 커피 브랜드 등)

- 독립변수 >(제3의변수)> 종속변수 

a가 b에게 어떠한 변화를 줄 것이다. a(독립, 원인변수) b (종속, 결과변수)