아나콘다 및 파이썬 설치(feat. 프롬프트, 빅분기)
파이썬은 웹 개발에서나 쓰는 줄 알았는데, 빅데이터 분석에도 쓰이는 걸 처음 알았다.
오픈소스라서 나중에도 쓸 수 있을 것이다.
파이참이나 다른 IDE를 쓸 수도 있겠지만, 아나콘다 프롬프트를 통해 생성한 쥬피터 노트북이 더 많이 쓰이는 듯하다.
빅분기를 볼 예정인 분들은 Groom에 들어가서 연습해도 무방할 듯하다.
목차
왜 파이썬을 직접 설치하지 않고, 아나콘다에서 다운로드 받는가?
개발자는 아니지만, 파이썬을 직접 받을 수 있는 것으로 안다.
파이썬 홈페이지에 나와 있기 때문이다.(https://www.python.org/)
그런데, 빅분기에서는 아나콘다로 받으라고 한다 왜인지 궁금했다.
구글링해본 결과 이유는 다음과 같다.
편리한 패키지 관리
아나콘다는 데이터 과학 및 머신 러닝에 필요한 다양한 패키지와 라이브러리를 미리 포함하고 있습니다. 이러한 패키지들은 데이터 처리, 시각화, 통계, 기계 학습 등 다양한 작업을 지원합니다. 아나콘다를 설치하면 이러한 패키지들을 별도로 설치하거나 관리할 필요 없이 바로 사용할 수 있습니다.
의존성 관리
아나콘다는 패키지 간의 의존성을 자동으로 처리합니다. 데이터 과학 작업을 할 때는 여러 패키지를 함께 사용해야 하는 경우가 많은데, 이러한 패키지들 간의 버전 충돌이 발생할 수 있습니다. 아나콘다는 의존성 문제를 해결하고 패키지 간의 충돌을 최소화하는 데 도움을 줍니다.
가상 환경 지원
아나콘다는 가상 환경(Virtual Environment)을 지원합니다. 가상 환경은 독립적인 파이썬 환경을 생성하여 각각의 프로젝트나 작업에 필요한 패키지를 분리하여 관리할 수 있게 해줍니다. 이를 통해 프로젝트 간의 충돌을 방지하고 패키지 관리를 더욱 효율적으로 할 수 있습니다.
플랫폼 독립성
아나콘다는 여러 운영체제(Windows, macOS, Linux)에서 동일하게 작동합니다. 따라서 동일한 분석 환경을 다른 플랫폼에서도 쉽게 구축할 수 있습니다.
이 부분도 중요한 것 같다. 수험생의 환경이 저마다 다를 수 있으니 말이다.
추가 도구와 통합
아나콘다는 데이터 과학 작업에 유용한 다양한 도구들을 제공하며, 이들 도구들은 아나콘다 네비게이터를 통해 쉽게 설치하고 관리할 수 있습니다. 예를 들어, Jupyter Notebook, JupyterLab, Spyder 등의 통합 개발 환경을 사용하여 데이터 분석 및 시각화 작업을 직관적이고 효율적으로 수행할 수 있습니다.
파이썬 설치 방법
아나콘다 다운로드 방법 요약
- Anaconda 다운로드 및 설치: Anaconda를 다운로드하고 설치합니다. 공식 웹사이트에서 최신 버전을 다운로드할 수 있습니다. Anaconda 다운로드 페이지
- 다운로드한 파일 실행: 다운로드가 완료되면 설치 파일을 실행합니다. 그리고 설치 프로세스를 따라가면 됩니다. Windows, macOS, Linux 모두에서 사용 가능합니다.
- 설치 중 경로 설정 (선택 사항): 설치 중에 경로 설정을 선택할 수 있습니다. 기본값으로 진행해도 되지만, 필요에 따라 경로를 변경할 수 있습니다.
- 환경변수 설정 (선택 사항): 설치 중에 'Add Anaconda to my PATH environment variable' 옵션을 선택하면 터미널에서 Anaconda 명령어를 사용할 수 있습니다. 선택하지 않으면 Anaconda Navigator를 통해 실행할 수 있습니다.
- 설치 완료 확인: 설치가 완료되면 터미널 또는 명령 프롬프트에서 다음 명령어로 Anaconda 버전을 확인합니다.
- Jupyter Notebook 실행: 터미널 또는 명령 프롬프트에서 다음 명령어를 사용하여 Jupyter Notebook을 실행합니다.
- Jupyter Notebook 인터페이스: 웹 브라우저에서 Jupyter Notebook 인터페이스가 열립니다. 여기서 새로운 노트북을 만들거나 기존의 노트북을 열 수 있습니다.
Step 1. 아나콘다 홈페이지에서 설치 파일 다운로드
파이썬 설치는 아나콘다부터 설치해야한다. https://www.anaconda.com/download
위 링크로 홈페이지를 방문하면 바로 다운로드 받을 수 있다.
요즘 랜섬웨어가 극성이니, 비트코인이 없다면 꼭 공식 홈페이지에서 다운받아야한다.
다운로드 버튼을 누르면 다운로드가 시작된다.
원하는 경로를 선택하고 아나콘다를 다운로드 하면 된다.
Step 2. 다운로드 받은 설치 파일 실행
다운로드 폴더에 이와 같은 아이콘이 있을 것이니 실행하면 된다.
물론, 다운로드 받은 곳이 다를 수 있다.
STEP 3. 설치 진행
설치 할 때 선택항목들이 많다.
책에서도 이 항목들에 대한 내용이 없다.
그래서 그냥 다 default로 되어 있는 내용들을 선택하여 설치를 진행한다.
STEP 4. 아나콘다 프롬프트 실행
윈도우 탐색기 > Anaconda3 폴더 > Anaconda Prompt 실행
Anaconda Powshell로 실행해도 무방하다고 한다.
STEP 5. 아나콘다 가상환경 구성
프롬프트에서 아래 명령어를 입력해준다.
conda create -n test python=3.7
위에서 test는 가상환경이름이며, 3.7은 파이썬 버전이다.
23년 5월 24일 기준 최신 파이썬 버전은 3.11.3 버전이다.
위 명령어를 입력하면 아래와 같이 진행된다.
아마도, 지난번에 시도해봤어서 내 로컬에서는 remove 후에 reinstall 된 것으로 보인다.
STEP 6. 아나콘다 - 환경 설정 조회
아래 명령어를 치면, 잘 설치됐는지 확인할 수 있다.
확인해 봤는데, 아마도 잘 설치 된 것 같다.
conda info --envs
STEP 7. 아나콘다 가상환경 활성화
아나콘다 가상환경 활성화 명령어는 다음과 같다.
conda activate test
앞서 가상환경 설정에서 test를 그대로 썼다면 복붙도 되지만, 바꾸었으면 test 부분을 자신의 환경명을 넣으면 된다.
STEP 8. 쥬피터 노트북 설치
가상환경을 활성화 했다면, 아래 명령어를 바로 입력하면된다.
(뭐 이렇게 할게 많은지...)
conda install jupyter notebook
진행여부를 묻는 내용이 있으면 모두 y해주면 된다.
그럼 또 뭐가 막 뜬다. 설치되고 있다는 내용이다.
STEP 9. 쥬피터 노트 가상환경과 커널 연결
아래 명령어를 입력하면, 가상환경과 커널이 연결된다.
커널(kernel)은 운영체제의 핵심 부분으로, 하드웨어와 소프트웨어 간의 인터페이스 역할을 담당한다고 한다.
운영체제는 컴퓨터 시스템의 자원을 효율적으로 관리하고 프로그램의 실행을 제어하기 위해 커널을 사용한다고 한다.
python -m ipykernel install --user --name test
STEP 10. 쥬피터 노트 실행
아래 명령어를 입력하면, 쥬피터 노트가 실행된다.
jupyter notebook
아래가 실행된 쥬피터 노트인데, 해당 URL을 넣으면 언제든 들어갈 수 있는 지 궁금하다. 환경설정이 필요한거니까 아마도 안되겠지만, 그냥 매번 이렇게 들어가야하나 걱정이다.
'빅데이터 분석기사' 카테고리의 다른 글
[무턱대고 빅데이터분석기사] Pandas란? | 명령어 | 분석방법 | 활용 예시 (0) | 2023.06.02 |
---|---|
[무턱대고 빅데이터 분석기사] Numpy를 활용한 데이터 다루기 | 설치부터 활용까지 | pandas와의 차이 (0) | 2023.05.31 |
자연어 처리(NLP)란? | 구현 방법 | NLTK | 페이스북에서 활용 (0) | 2023.05.27 |
빅데이터 분석에서 많이 쓰는 기법 TF-IDF란? | TF-IDF 방법 | TF-IDF 예시 | 비판점 (0) | 2023.05.27 |
[무턱대고 빅데이터분석기사실기] 빅데이터 분석 기사란? (0) | 2023.05.22 |
댓글