해결됨: dict를 사용하여 누락된 값 pandas 대체

마지막 업데이트 : 09/11/2023

데이터 조작 및 분석의 세계에서 누락된 값을 처리하는 것은 중요한 작업입니다. 판다널리 사용되는 Python 라이브러리인 를 통해 누락된 데이터를 효율적으로 관리할 수 있습니다. 누락된 값을 처리하는 일반적인 방법 중 하나는 사전을 사용하여 이러한 값을 매핑하고 바꾸는 것입니다. 이 기사에서는 Pandas 및 Python의 기능을 활용하여 사전을 사용하여 데이터 세트에서 누락된 값을 대체하는 방법에 대해 설명합니다.

해법

우리가 살펴볼 기본 솔루션은 다음을 사용하는 것입니다. 필나() 사전과 함께 작동합니다. 이 접근 방식을 사용하면 누락된 값을 지정된 사전의 해당 값으로 바꿀 수 있습니다.

코드에 대한 단계별 설명

이 프로세스를 설명하기 위해 의류, 색상 및 역사적 맥락을 포함하여 다양한 패션 스타일에 대한 정보가 포함된 데이터 세트가 있다고 가정해 보겠습니다. 경우에 따라 이 데이터 세트에 누락된 값이 있을 수 있습니다.

먼저 필요한 라이브러리를 가져오고 샘플 DataFrame을 만듭니다.

import pandas as pd

data = {
    'style': ['Grunge', 'Bohemian', 'Preppy', None, 'Punk', 'Casual'],
    'garments': ['Plaid shirt', None, 'Blazer', 'Maxi dress', 'Leather jacket', 'T-shirt'],
    'colors': ['Black', 'Faded', 'Light', 'Earthy', None, None]
}

df = pd.DataFrame(data)

이제 문제를 설명하는 DataFrame이 있으므로 일부 값이 누락되었습니다(None으로 표시됨). 이러한 값을 바꾸려면 적절한 매핑이 포함된 사전을 만듭니다.

style_dict = {None: 'Unknown'}
garments_dict = {None: 'Other'}
colors_dict = {None: 'Various'}

# Combine dictionaries
replacement_dict = {'style': style_dict, 'garments': garments_dict, 'colors': colors_dict}

마지막으로, 필나() 결합된 사전을 사용하여 누락된 값을 대체하는 함수:

df_filled = df.fillna(replacement_dict)

Pandas 라이브러리 이해

판다 데이터 조작 및 분석을 위해 설계된 Python의 다목적 라이브러리입니다. Series 및 DataFrame과 같은 유연하고 강력한 데이터 구조를 제공합니다. 이러한 구조는 구조화된 테이블 형식 데이터로 효율적으로 작업하는 데 필수적입니다.

Pandas는 다음과 같은 풍부한 기능 모음을 제공합니다. 필나(), 누락된 데이터를 처리하는 데 사용됩니다. 데이터 병합, 데이터 피벗, 시계열 분석과 같은 다른 작업은 Pandas로 원활하게 수행할 수 있습니다.

결측 데이터 처리 기능

이외에도 필나() Pandas는 다음과 같이 누락된 데이터를 처리하기 위한 몇 가지 다른 기능과 방법을 제공합니다.

  • 드롭나(): 누락된 데이터가 있는 행 또는 열을 제거합니다.
  • 이사나(): 누락되었거나 null인 DataFrame 또는 Series 요소를 확인합니다.
  • 노나(): 누락되거나 null이 아닌 DataFrame 또는 Series 요소를 확인합니다.
  • 보간하다(): 선형 보간을 사용하여 누락된 값을 채웁니다.

이러한 방법과 함께 필나(), 다양한 상황에서 누락된 데이터를 처리하기 위한 포괄적인 도구 모음을 제공합니다.

결론적으로, 이 기사는 사용 방법을 보여주었습니다. 딕셔너리 Pandas DataFrame에서 누락된 값을 대체합니다. 우리가 사용한 주요 기능, 필나(), 누락된 데이터를 효율적으로 처리할 수 있게 해주는 Pandas 라이브러리의 강력한 도구입니다. 사전을 활용하여 누락된 값을 적절한 대체 항목에 매핑하고 데이터 세트가 완전하고 의미 있는지 확인할 수 있습니다. Pandas 라이브러리와 포함된 기능에 대한 깊은 이해를 통해 대규모 데이터 세트를 효과적으로 사용하고 데이터에서 귀중한 통찰력을 얻을 수 있습니다.

관련 게시물: