LLM 양자화 비트별 성능 벤치마크 결과 정리와 추천팁

LLM 양자화 비트별 성능 벤치마크 결과와 함께 최적화 팁을 제공해 모델 효율 향상을 원하는 연구자와 개발자에게 유용합니다