본문 바로가기

의학/통계(SPSS)

SAS 통계 프로그램 소개 (장점, 단점, 빅데이터, statistical analysis system, strategic application system, 통계교육원 강의)

728x90

통계 프로그램에는 SPSS, SAS, STATA, R 등 여러 가지가 있다.

2018년도에 통계교육원에서 SAS 온라인 강좌가 있었다.

유료 강좌도 있고 무료 강의도 있다.




SAS system이란

데이터를 올바른 정보(right information)로 변환하여

정보를 필요로 하는 사람(right person)에게

가장 적절한 시기(right time)에 정보를 제공할 수 있는

통합 애플리케이션 소프트웨어이다.

 

SAS 약자

예전: 통계 분석 시스템(statistical analysis system)

최근: 전략적 응용 시스템(strategic application system)

 

평균, 최대값 구하기, 자료를 크기 순으로 나열하고 특정 값이 몇 번째인지 구하는 등의 처리를

Visual Basic, FORTRAN 등 일반적인 컴퓨터 언어로 처리한다면 명령어로 4~50줄은 필요할 것이다.

SAS는 몇 줄의 명령문만으로 여러 가지 통계 결과를 제공할 수 있다고 한다.






다른 통계 프로그램도 많지만 SAS를 추천하는 이유, 장점은 다음과 같다.

1) 자료 관리와 처리의 효율성이 다른 프로그램보다 높다. 특히 매우 크기가 큰 자료(빅데이터 등)를 읽어 들이거나 사용하는 데에 용이하며, 다양한 분석을 시도해야 하는 경우에 좋다.

2) 컴퓨터 언어로 처리하면 며칠씩 걸리는 작업도 SAS를 이용하면 몇 줄의 프로그램으로 간단히 처리할 수 있다. SAS의 프로그램은 세미콜론(;)으로만 구분되는 free format 형식이므로 다른 언어에 비해 배우기 쉽다. 하지만 SPSS, Minitab 등 다른 통계 프로그램에 비해서는 어려울 수 있다.

3) 파일 관리에 상당한 융통성이 있어 일정 수준에 이르면 자유 자재로 여러 형태의 자료를 다룰 수 있다. 오라클 DB로부터 데이터 가져오기, 엑셀파일로 저장하기, hwp용으로 편집하기, HTML로 인터넷에 게시하기 등이 가능하다.

4) 자료가 정형화되어 있는 경우 프로그램을 한 번 해 놓으면 시간을 줄일 수 있어서 윈도우 메뉴를 선택하는 다른 프로그램에 비해 재사용성이 뛰어나다. 통계청 등 통계작성기관에서 사용하기 좋다.

5) Windows, LINUX, UNIX 등 운영체제에 무관하게 활용 가능하다. SAS는 주요 소프트웨어의 결합으로 구성되어 있어서 필요한 모듈만 사용할 수 있다. 주로 사용하는 모듈로는 SAS/BASE, SAS/STAT, SAS/ETS, SAS/GRAFP, SAS/ACCESS 등이 있다.

 

SAS의 단점은 다음과 같다.

1) 비용 (가격이 비싸다.)

2) 프로그램이 크다.

3) 범용성이 낮아 모두에게 보급하기 어렵다.

이러한 단점 때문에 R 등의 무료 소프트웨어, 범용성이 뛰어난 Excel 등을 활용하기도 하지만, 통계청 등에서는 SAS가 많이 활용되고 있다.

728x90