본문 바로가기

분류 전체보기79

[AI] Kaggle 데이터로 데이터 분석하기_ Student's Academic Performance Dataset 안녕하세요! 23년 6월 24일에 있을 빅데이터 분석기사 실기를 준비하면서 준비를 해도 불안함 마음으로 더 많은 자료를 찾는 분들이 있으실 텐데요 조금이라도 도움이 되고자 Kaggle 데이터를 활용해서 작업형 2 유형을 다뤄보겠습니다! Kaggle 입문자들에게도 좋을 것 같네요 https://www.kaggle.com/datasets/aljarah/xAPI-Edu-Data Students' Academic Performance Dataset xAPI-Educational Mining Dataset www.kaggle.com 데이터는 오른쪽 상단에서 Copy API command를 통해 가져오실 수 있습니다 이후 다음처럼 발급받은 username과 key를 입력하도록 하겠습니다 os.environ['KAG.. 2023. 6. 17.
[AI] Kaggle Data로 데이터 분석하기_Heart Failure Prediction 안녕하세요! 23년 6월 24일에 있을 빅데이터 분석기사 실기를 준비하면서 준비를 해도 불안함 마음으로 더 많은 자료를 찾는 분들이 있으실 텐데요 조금이라도 도움이 되고자 Kaggle 데이터를 활용해서 작업형 2 유형을 다뤄보겠습니다! Kaggle 입문자들에게도 좋을 것 같네요 Heart Failure Prediction 12 clinical features por predicting death events. www.kaggle.com 데이터는 오른쪽 상단에서 Copy API command를 통해 가져오실 수 있습니다 이후 다음처럼 발급받은 username과 key를 입력하도록 하겠습니다 os.environ['KAGGLE_USERNAME'] = 'sihyunlee9604' os.environ['KAGGL.. 2023. 6. 16.
[Error] ImportError: cannot import name 'getNsvData' from 'getData' 파이썬 파일에 함수를 만들어서 다른 파일에서 여는 작업을 흔하게 하곤한다. 하지만 이때 위 제목과 같은 에러가 발생하곤 한다. 사실 이전까지는 이런 경험이 없었는데 별짓 다 해봐도 이유를 못찾겠어서 한참 헤맸다. getData라는 파일이 이미 있어서 그렇다는건데, 이러한 경우는 파일의 명을 바꿔주면 된다. 코드가 정상적으로 실행되는 것을 확인할 수 있다. 2023. 6. 9.
Anomaly Detection_PCA PCA(Principal Component Analysis)는 데이터셋에서 가장 중요한 변수를 추출하고 차원을 축소하는 데에 널리 사용되는 방법입니다. 이 기법은 고차원 데이터를 저차원으로 축소하여 시각화 및 분석을 용이하게 하며, 불필요한 정보를 제거하여 노이즈를 감소시키는 효과가 있습니다. PCA 기반 이상탐지는 PCA를 사용하여 데이터의 차원을 축소한 후, 축소된 차원에서 이상값을 탐지하는 방식입니다. PCA는 데이터의 고유값(eigenvalues)과 고유벡터(eigenvectors)를 계산하여 이들을 이용하여 데이터를 재배치합니다. 이렇게 재배치된 데이터에서는 상위 고유값에 해당하는 고유벡터가 가장 중요한 변수를 나타내므로, 이를 기반으로 데이터의 차원을 축소할 수 있습니다. 장점: 변수 선택과 .. 2023. 5. 3.