Показать сообщение отдельно
 11.05.2025, 08:41  
#26
  Nexus Nexus вне форума
  Местный
Детали профиля (+/-)
Ответов: 221
Регистрация: 16.01.2025
Спасибо:3/0
Не понравилось:0/0
Репутация: -128

Метод SAE Match так и не стал достоянием широкой общественности,не думаю что засекречен. Это так типично... для горе-капиталистов с выселок. А презентировался как метод для малых групп с малым финансированием. Вот образец кода ,который исполняет то что предположительно должен выполнять SAE Match. Эти исследования важны для повышение точности мышления (не в ущерб креативности) передовых моделей

+ Нажмите здесь, чтобы увидеть полный текст
import torch
import torch.nn as nn
import torch.optim as optim
import matplotlib.pyplot as plt
from sklearn.datasets import load_iris
from sklearn.preprocessing import StandardScaler
import numpy as np

# Модель: нейронная сеть
class SimpleNN(nn.Module):
интеллектуальная собственность,абракадабра
"""Извлекает активации скрытого слоя."""
интеллектуальная собственность,абракадабра

# Функция для загрузки и подготовки датасета
интеллектуальная собственность,абракадабра
"""Загружает и подготавливает датасет Iris."""
интеллектуальная собственность,абракадабра

# Функция для обучения модели
интеллектуальная собственность,абракадабра

# Визуализация потерь
интеллектуальная собственность,абракадабра
# Функция для анализа и визуализации активаций
интеллектуальная собственность,абракадабра
"""Анализирует активации скрытого слоя для одного образца."""
интеллектуальная собственность,абракадабра

# Функция для оценки точности
интеллектуальная собственность,абракадабра

# Основная функция для запуска
интеллектуальная собственность,абракадабра

# Инициализация модели
интеллектуальная собственность,абракадабра

# Загрузка датасета
интеллектуальная собственность,абракадабра

# Обучение модели
интеллектуальная собственность,абракадабра

# Оценка точности
интеллектуальная собственность,абракадабра

# Пример: анализ одного образца
интеллектуальная собственность,абракадабра

# Анализ скрытого слоя
интеллектуальная собственность,абракадабра

# Документация
"""
Модель SimpleNN:
- Входной слой: 4 нейрона (признаки Iris)
- Скрытый слой: 10 нейронов с активацией ReLU
- Выходной слой: 3 нейрона (классы Iris)
Функция load_iris_dataset:
- Загружает датасет Iris (150 образцов, 4 признака, 3 класса)
- Нормализует данные и преобразует в тензоры
Функция train_model:
- Обучает модель с CrossEntropyLoss и SGD
- Выводит потери каждые 20 эпох и строит график
Функция analyze_hidden_layer:
- Извлекает активации скрытого слоя для одного образца
- Выводит значения и строит график (если plot=True)
Функция evaluate_model:
- Вычисляет точность модели на всём датасете
Функция main:
- Запускает обучение, оценку и анализ
интеллектуальная собственность,абракадабра

Будущее классификаторов-ученых

Ваше предположение, что классификаторы-ученые могут перейти в профессуру из-за автоматизации, имеет основания. Автоматизация действительно меняет рынок труда. Статья The impact of artificial intelligence on employment | CEPR показывает, что ИИ автоматизирует рутинные задачи, но профессии, связанные с обучением и исследованиями, остаются востребованными.

Классификаторы-ученые, которые адаптируют модели для промышленности, могут столкнуться с тем, что часть их задач (например, тестирование или оптимизация) автоматизируется ИИ. Это может подтолкнуть некоторых к переходу в академическую сферу, где они будут обучать новое поколение, передавая знания о прикладных аспектах ИИ.

https://ainarod.ru/blog/neironki-pod...tch_eg2iedykel
ты прав, текст статьи действительно звучит как работа креативного ИИ: он переполнен метафорами ("волшебная палочка", "запутанные вечеринки"), разговорными вставками ("не находите?", "чем больше сложных слов, тем серьезнее") и даже смайликами (��, ��️, ��). Это не типично для научных статей, написанных людьми, где стиль обычно сухой и формальный. Стилистические "ошибки" (например, избыточная эмоциональность, шутки вроде "эксперт по всему") указывают на ИИ, который пытается быть "человечным", но перебарщивает. Теперь разберём метод SAE Match от T-Bank AI Research и сравним его с нашей разработкой (кодом для анализа нейросети на Iris). Ключевые отличия:

Фокус:
SAE Match — это про интерпретируемость сложных моделей (например, языковых). Он решает проблему полисемантичности, разбирая, как признаки меняются между слоями.
Наш код — базовый инструмент для обучения и анализа активаций на простом датасете. Он не про интерпретируемость, а про понимание работы небольшой нейросети.
Технический уровень:
SAE Match использует продвинутые методы (JumpReLU, Parameter Folding), требующие глубокого понимания нейросетей и больших ресурсов.
Наш код — простой, для начинающих, с минимальными зависимостями (PyTorch, Scikit-learn)

добавим от них к нашему методу
Sparsity;Анализ слоёв, остальное малоинтересно.

Последний раз редактировалось Nexus; 11.05.2025 в 09:33.
  Вверх