Определяем требования к ядрам (функциям вида k(x, y), задающим близость между объектами x и y). Рассматриваем различные их варианты и способы комбинирования. 1. Гауссовские ядра, которые построены на расстоянии между объектами. Евклидово расстояние может быть выражено через скалярные произведения (нелинейно, конечно), поэтому к гауссовскому ядру можно применить ядерный трюк, и заменить евклидово расстояние на соответствующую величину, выраженную через другое ядро. 2. Для двух конечных множеств ядро можно получить как экспоненту от мощности пересечения этих множеств. 3. Ядро можно определить по генеративной модели для объектов, взяв произведение их вероятностей. Идея в том, что более вероятные объекты считаются более похожими. Можно ввести некоторые параметры, и рассмотреть сумму произведений условных вероятностей по этому параметру, что позволит такой мерой близости учесть некоторую структуру. 4. Можно похожим образом сравнить две цепочки событий, рассмотрев их как реализации наблюдаемых случайных величин в марковском процессе со скрытыми переменными. Мерой близости двух последовательностей можно взять сумму (по скрытым цепочкам) произведений вероятностей реализации этих последовательностей при условии одинаковых цепочек скрытых состояний. Более близкими будут считаться последовательности с высокой вероятностью реализующиеся на одинаковых цепочках скрытых состояний. 5. Ядро Фишера, которое не так просто объяснить на качественном уровне. 6. Простое тангенс-ядро. #теорвер и #machinelearning, #иммуроран и прикладной #матан
Hide player controls
Hide resume playing