#transformer

AI가 선별한 아티클

5·ai-ml·분석·r/MachineLearning·2026. 05. 23.

Alignment: Higher order prioritizing over constraints [R]

이 글은 기계의 의미 정렬 및 제약 조건 우선 순위에 대해 논의합니다.

The article discusses machine alignment and prioritization over constraints.

#transformer #alignment #clarity seeking #constraints #statistical system

요약 보기 원문 →

5·ai-ml·기타·r/MachineLearning·2026. 05. 22.

Custom image encoder [P]

영상 프레임 분류를 위한 이미지 인코더 구축에 대한 논의입니다.

Discussion on building a custom image encoder for video frame classification.

#clip #siglip #transformer #dino #cpu

요약 보기 원문 →

7·ai-ml·릴리즈·InfoQ·2026. 05. 22.

Uber Improves Restaurant Recommendations Using Real-Time Signals and Listwise Ranking

Uber Eats가 실시간 신호와 리스트 방식 순위를 활용하여 추천 시스템을 개선했습니다.

Uber Eats improves its recommendation system using real-time signals and listwise ranking.

#transformer #recommendation #seq2seq #generative #personalization

요약 보기 원문 →

8·ai-ml·분석·r/MachineLearning·2026. 05. 19.

Graph spectral analysis (Fiedler value + Scheffer CSD indicators) predicts grokking 21k steps before loss function - five reproducible experiments [R]

Fiedler 값과 Scheffer 지표를 통해 신경망 학습 중 grokking을 예측한 연구.

Research predicts grokking in neural networks using Fiedler value and Scheffer indicators.

#fiedler #scheffer #mlp #transformer #neural networks

요약 보기 원문 →

5·ai-ml·기타·r/MachineLearning·2026. 05. 19.

Need reliable source for 30+ years of S&P 500 historical data for LSTM/Transformer research [P]

LSTM과 Transformer 모델을 이용한 S&P 500 예측을 위한 30년 역사적 데이터 소스를 찾고 있습니다.

Looking for reliable 30-year historical data for S&P 500 for LSTM and Transformer research.

#lstm #transformer #sp500 #yahoo finance #kaggle

요약 보기 원문 →

7·ai-ml·분석·r/MachineLearning·2026. 05. 15.

Orthrus: Memory-Efficient Parallel Token Generation via Dual-View Diffusion [R]

Orthrus는 메모리 효율적인 병렬 토큰 생성을 위한 기술을 소개합니다.

Orthrus presents a technology for memory-efficient parallel token generation.

#transformer #diffusion #tfd #ar #language-model

요약 보기 원문 →

7·ai-ml·분석·r/MachineLearning·2026. 05. 13.

Trained transformer-based chess models to play like humans (including thinking time) [P]

인간처럼 체스하는 트랜스포머 기반 모델 훈련 내용.

Training of transformer-based chess models to play like humans.

#pytorch #nanobind #deep learning #transformer #lichess

요약 보기 원문 →

7·ai-ml·분석·당근마켓 Tech·2026. 02. 27.

‘로컬’ 슈퍼 앱에서 장기 유저 모델링은 어떻게 달라질까?

장기 사용자 모델링을 통한 추천 시스템 개선 방안을 논의하는 글입니다.

The article discusses improvements in recommendation systems through long-term user modeling.

#transformer #recommendation #user_embedding #offline_learning #data_scaling

요약 보기 원문 →

7·ai-ml·분석·OpenAI Blog·2024. 02. 15.

Video generation models as world simulators

비디오 데이터의 생성 모델을 활용한 세계 시뮬레이터 개발을 탐구합니다.

Exploring video generation models for building simulators of the physical world.

#transformer #diffusion #generative #sora #video

요약 보기 원문 →

5·ai-ml·기타·Changelog News·2023. 04. 24.

Dataset wars, Bark, Kent Beck needs to recalibrate, StableLM & blind prompting is not prompt engineering

데이터셋 전쟁과 Bark 음성 생성 모델에 대한 논의.

Discussion on dataset wars and the Bark speech generation model.

#bark #stable diffusion #transformer #chatgpt #prompt engineering

요약 보기 원문 →

7·ai-ml·분석·OpenAI Blog·2020. 06. 17.

Image GPT

대규모 변환 모델이 이미지 생성에서도 효과적임을 보여줍니다.

A large transformer model demonstrates effective image generation capabilities.

#transformer #image generation #pixel sequences #convolutional networks

요약 보기 원문 →

6·ai-ml·분석·OpenAI Blog·2019. 12. 05.

Deep double descent

딥 러닝 모델에서 발생하는 더블 디센트 현상을 설명합니다.

Deep double descent phenomenon observed in CNNs, ResNets, and transformers is discussed.

#cnn #resnet #transformer

요약 보기 원문 →

7·ai-ml·기타·OpenAI Blog·2019. 04. 25.

MuseNet

MuseNet은 다양한 스타일로 4분짜리 음악을 생성하는 신경망입니다.

MuseNet is a neural network that generates 4-minute musical compositions in various styles.

#midi #transformer #gpt-2 #deep learning #neural network

요약 보기 원문 →

모든 아티클을 불러왔습니다.