Java CSV 데이터 처리를 위한 Fahmatrix 라이브러리 활용
카테고리
프로그래밍/소프트웨어 개발
서브카테고리
개발 툴
대상자
Java 개발자 (중간 이상 수준)
- 난이도: 기초 Java 문법과 라이브러리 사용법 이해 필요*
핵심 요약
- Fahmatrix는 Python의 Pandas를 모방한 JVM 기반 CSV 데이터 처리 라이브러리
- DataFrame 및 Series 클래스를 통해 행/열 기반 데이터 조작 가능
getRowsByPosition()
및getColumnsByLabel()
메서드로 필요한 데이터만 선택 가능
섹션별 세부 요약
1. 라이브러리 설치 방법
- GitHub에서
fahmatrix-vxxx.jar
파일 다운로드 - Eclipse IDE에서 프로젝트에 외부 JAR 파일 추가 (프로젝트 > Java Build Path > Add External JARs)
./libs
폴더에 JAR 파일 저장 후 추가
2. 간단한 CSV 데이터 처리 예제
SimpleCSV.java
클래스 생성 후 다음 코드 작성:
```java
import com.fahmatrix.DataFrame;
import com.fahmatrix.Series;
public class SimpleCSV {
public static void main(String[] args) {
DataFrame df = new DataFrame();
df.readCSV("path//to//data.csv");
// 특정 행 선택 (1,2,3,...15행)
DataFrame result = df.getRowsByPosition(new int[]{1,2,3,4,5,10,11,12,13,14,15});
// 특정 열 선택 ("name", "address", "city")
result = result.getColumnsByLabel(new String[]{"name","address","city"});
}
}
```
result.print()
로 필터링된 데이터 출력
3. 핵심 기능 설명
- DataFrame 클래스: CSV 파일을 메모리에 로드하고 조작
- getRowsByPosition() 메서드: 인덱스 기반 행 선택
- getColumnsByLabel() 메서드: 열 이름 기반 컬럼 선택
결론
- Fahmatrix는 Pandas와 유사한 인터페이스로 CSV 데이터 필터링을 간단하게 처리 가능
DataFrame
및Series
클래스 활용하여 행/열 기반 조작 가능- GitHub에서 최신 버전 확인 및 추가 기능 활용 권장