본문 바로가기
728x90
반응형

빅분기5

[빅분기] groupby 후 .reset_index()의 역할 [빅분기] groupby 후 loc나 iloc 적용 방법 .reset_index()의 역할은 현재의 인덱스를 기본 정수 인덱스로 되돌리고 기존 인덱스를 DataFrame의 열로 전환하는 것입니다. 이는 그룹화 및 집계 작업 후 원래의 인덱스였던 열을 다시 사용할 수 있게 합니다..reset_index()가 필요한 이유그룹화 및 집계 후 인덱스 변화: df.groupby(['city', 'f2']).sum()을 수행하면, 'city'와 'f2' 열이 인덱스로 변환됩니다. 이 상태에서는 'city'와 'f2'는 더 이상 DataFrame의 열이 아니기 때문에, 직접 참조하기 어렵습니다.정렬 후 행 참조: sort_values(by='views', ascending=False)로 정렬한 후에도 여전히 'cit.. 2024. 5. 24.
파이썬 데이터 타입 완전 정복 - 튜플, 리스트, 딕셔너리, 집합 파이썬 데이터 타입 완전 정복 - 튜플, 리스트, 딕셔너리, 집합 목차 파이썬의 데이터 타입 파이썬의 데이터 타입이 뭐가 있는 지 궁금해 하는 사람이라면, 아마 단일 데이터 타입이 아닌 복합형 데이터 타입을 궁금해할 가능성이 높다. 단일 데이터 타입은 정수, 실수, 문자형, 불리언, 논타입 등을 말한다. 개발자라면 이미 충분히 아는 내용일 것이며, 비개발자라면 처음들을 가능성이 높다. 빅분기를 준비하는 분들이라면, 함께 알아두면 좋다. error 내용 중에 가끔 이러한 내용이 나올 수 있기 때문이다. 본 설명의 예시 이미지들은 모두 Jupyter notebook을 이용했다. 해당사항은 아래 글에서 상세히 확인할 수 있습니다 : ) 2023.05.24 - [빅데이터 분석기사] - 아나콘다 및 파이썬 설치(.. 2024. 2. 3.
[빅데이터분석기사] 제 1유형 기출 문제 파해치기 - 1 | 풀이 모음 | 여러 방식 | 핵심정리 [빅데이터분석기사] 제 1유형 기출 문제 파해치기 | 풀이 모음 | 여러 방식 | 핵심정리 목차 제 1유형은 레코드수, 최소 값, 최대 값을 구하거나 특정 변수를 생성하여 저장하는 것 그리고 내림차순, 오름 차순 정렬하는 것이 주로 나오는 것 같다. 즉, 대부분 하나의 컬럼을 기준으로 데이터를 다루고 특정 정규화 혹은 중심 경향성을 계산할 줄 아는지, 그 기준으로 다시 정렬하거나 기본적인 수행이 가능한지 물어 보는 것 같다. 제 1유형 과거 문제 유형 Q1. (정규화 후 기준을 세워 레코드 수를 찾는 문제) mtcars 데이터셋(data/mtcars.csv)의 qsec 컬럼을 최소최대 척도(Min-Max Scale)로 변환한 후 0.5보다 큰 값을 가지는 레코드 수를 구하시오. Q2. 데이터셋의 'f5'.. 2023. 6. 21.
아나콘다 및 파이썬 설치(feat. 프롬프트, 빅분기) 아나콘다 및 파이썬 설치(feat. 프롬프트, 빅분기) 파이썬은 웹 개발에서나 쓰는 줄 알았는데, 빅데이터 분석에도 쓰이는 걸 처음 알았다. 오픈소스라서 나중에도 쓸 수 있을 것이다. 파이참이나 다른 IDE를 쓸 수도 있겠지만, 아나콘다 프롬프트를 통해 생성한 쥬피터 노트북이 더 많이 쓰이는 듯하다. 빅분기를 볼 예정인 분들은 Groom에 들어가서 연습해도 무방할 듯하다. 목차 왜 파이썬을 직접 설치하지 않고, 아나콘다에서 다운로드 받는가? 개발자는 아니지만, 파이썬을 직접 받을 수 있는 것으로 안다. 파이썬 홈페이지에 나와 있기 때문이다.(https://www.python.org/) 그런데, 빅분기에서는 아나콘다로 받으라고 한다 왜인지 궁금했다. 구글링해본 결과 이유는 다음과 같다. 편리한 패키지 관리.. 2023. 5. 24.
[무턱대고 빅데이터분석기사실기] 빅데이터 분석 기사란? [무턱대고 빅데이터분석기사실기] 빅데이터 분석 기사란? 통계는 제법 다뤄봤지만, 빅데이터 분석은 해본 적이 없다. IT 기업의 마케터라함은 이 정도는 따야지 싶어 시작했는데, 빅분기 실기는 쉽지 않아 보인다. 목차 빅데이터 분석기사란? 빅데이터 분석기사는 빅데이터를 수집, 관리, 분석하고 결과를 해석하는 전문가를 말합니다. 이러한 전문가는 기업이나 기관에서 발생하는 대량의 데이터를 수집하고 저장하여, 해당 데이터에서 가치 있는 정보와 통찰력을 도출하는 역할을 수행합니다. 빅데이터 분석기사는 데이터를 수집하고 정리하는 데이터 전처리 과정부터 데이터 모델링, 예측 분석, 시각화, 결과 해석 등 다양한 작업을 수행합니다. 이를 위해 데이터베이스, 데이터 마이닝, 통계학, 머신 러닝, 데이터 시각화 등의 지식과.. 2023. 5. 22.
728x90
반응형