빅데이터7 SAS Syntax 이해하기 SAS는 통계 분석 및 데이터 관리를 위한 강력한 도구입니다.광범위한 기능과 사용자 친화적인 인터페이스로 인해 다양한 산업 분야에서 사용됩니다. SAS 문법의 기본 사항 SAS 프로그램은 스텝의 연속으로 구성됩니다. SAS 프로그램의 기본 구조SAS 프로그램은 크게 두 가지 유형의 스텝으로 이루어져 있습니다.데이터 스텝(Data Step): 데이터를 읽고, 변형하고, 새로운 데이터를 생성하는 역할을 합니다.프로시저 스텝(Proc Step): 데이터를 분석하고, 통계 처리하고, 보고서를 생성하는 역할을 합니다./* Data 스텝 예제 */DATA mydata; SET mylib.cars;RUN;/* Proc 스텝 예제 */PROC PRINT DATA=mydata;RUN; 스텝의 구성 요소각 스텝은 다음과.. 2025. 2. 21. SAS 공부할 때 참고하기 좋은 정보 SAS를 검색하고 찾고 있다는 것은 회사에서 사용한다는 이야기 일 것입니다.그리고 SAS를 담당하거나 또는 활용하는 경우일 것입니다. 당장 일을 해야겠는데, 바로 교육을 받을 수는 없고, 그래서 검색을 하고 있는 것이라면 잘 찾아 오셨습니다. SAS 를 공부할 때 필요한 정보입니다. 기본 문법을 공부할 때 보기 좋은 강의 입니다. 기본적인 것은 다 있으나, 결정적일 때 전자책에만 있다고 나옵니다. 7900원이니 한번 구입해볼법도 하지만 쉽게 결제 할 마음이 생기지 않습니다.https://wikidocs.net/book/2678 SAS로 하는 기초 데이터 전처리, 핸들링(Data handling)SAS를 활용한 데이터 전처리를 다루는 책입니다. SAS를 이용해서 통계분석을 다루는 책은 많이 있지만, .. 2025. 2. 12. [IT/DATA] 데이터 레이크 하우스란? 최근 데이터 플랫폼의 방향은 '데이터 레이크하우스' 입니다. 데이터웨어하우스, 데이터레이크의 단점을 보완하기 위해서 만들어진 개념입니다. 데이터레이크는 데이터웨어하우스로 수용하기 힘든 비정형 데이터 활용에 초점을 둔 아키텍처입니다. 초기의 데이터레이크는 데이터웨어하우스와 병존했는데, 데이터레이크와 DW을 단일 플랫폼으로 통합하자는 아이디어로 데이터레이크하우스가 고안되고 있습니다. 관리 부담을 줄이면서, 활용 수준을 높이는 게 주요 목표입니다. 아래는 데이터레이크하우스에 대한 설명입니다. zdnet을 참조하였습니다. ■ 데이터레이크하우스 조직 내에서 데이터 활용 수요가 늘어나고 다양해지면서, 관계형 형식으로 여러 컴퓨팅 노드에서 병렬로 방대한 양의 데이터를 처리할 수 있는 최신 데이터웨어하우스 아키텍처를 .. 2023. 9. 11. [IT/AWS] AWS Certified Cloud Practitioner AWS Certified Cloud Practitioner를 취득하면 AWS 클라우드의 개념, 서비스 및 용어에 대한 기초 지식을 습득할 수 있습니다. 이 자격증은 사전 IT 또는 클라우드 경험이 없거나 온프레미스 IT 경험을 가지고 있지만 기초적인 AWS 클라우드 숙련도를 기르고자 하는 비기술적 직원에게 있어서 좋은 출발점입니다. 이 자격증을 취득하면 역할 기반 AWS Certification을 취득하기에 앞서 자신감을 얻을 수 있습니다. AWS Certified Cloud Practitioner (CLF-C01) 시험은 특정 직무에 관계없이 AWS 클라우드에 대한 전반적인 지식을 효과적으로 입증할 수 있는 개인을 대상으로 합니다. 시험에서는 응시자가 다음 태스크를 완료할 수 있는지 확인합니다. AWS.. 2022. 12. 20. [DATA/기사] AWS, '제로 ETL' 선언…"최신정보 실시간 확보" 확실히 세상은 빠르게 변하네요. 좋은 기사가 있어서 공유합니다. https://zdnet.co.kr/view/?no=20221130092920#_enliple AWS, '제로 ETL' 선언…"최신정보 실시간 확보" [라스베이거스(미국)=김우용 기자] 아마존웹서비스(AWS)가 기업의 데이터 활용에서 소소하지만 큰 골칫거리인 'ETL'을 없애겠다고 약속했다. 우선 자사의... zdnet.co.kr 아래는 기사의 핵심 내용입니다. '아마존 오로라 제로ETL 인티그레이션 위드 아마존 레드시프트'는 AWS의 RDBMS 서비스인 아마존 오로라에 저장된 데이터를 DW 서비스인 '아마존 레드시프트'로 자동으로 복제하는 기능이다. 그동안 두 서비스 간 데이터 이동과 변환을 위해 AWS 글루 같은 별도 ETL 도구를 사용.. 2022. 12. 1. [IT/Data] 빅데이터 에코시스템 빅데이터 에코시스템 빅데이터는 수집, 정제, 적재, 분석, 시각화의 여러 단계를 거칩니다. 이 단계를 거치는 동안 여러가지 기술을 이용하여 처리되고, 이 기술들을 통틀어 빅데이터 에코 시스템(Bigdata Eco System)이라고 합니다. 유명한 도구/기술들에 대해서 간략하게 설명 드립니다. 용어에 익숙해지세요. 수집기술 수집기술은 빅데이터 분석을 위한 원천 데이터를 수집하는 기술입니다. 원천 데이터는 실시간 데이터 수집 기술, 배치 데이터 수집기술이 있습니다. 원천 데이터의 종류에도 로그 데이터, DB 데이터, API 호출 데이터 등 여러가지 종류가 있습니다. 플룸(Flume) - 플룸은 클라우데라에서 개발한 서버 로그 수집 도구 입니다. 카프카(Kafka) - 카프카는 링크드인에서 개발한 분산 메시.. 2022. 11. 17. 이전 1 2 다음 728x90 반응형