Авто класса в модели цена: купить, продать и обменять машину

Содержание

Автомобили, которые меньше всего теряют в цене: подборка машин

Уже семь лет «Автостат» проводит ежегодное исследование, где оценивает остаточную стоимость трехлетнего автомобиля при продаже. Мы выбрали лучшие 11 автомобилей из 270 моделей и 49 марок, которые можно выгодно продать на вторичном рынке.

KIA Rio X-line

Теряет 2% цены за первые три года

Цена: от 939 900 Р

B-класс. Улучшенная версия народного автомобиля Kia Rio: увеличенный клиренс, рейлинги на крыше, а также антигравийные накладки на пороги и колесные арки

Hyundai Creta

Теряет 8,3% цены за три года

Цена: от 1 127 000 Р

SUV B-класса. Самый популярный кроссовер на российском рынке. В Китае модель называют ix-25. Летом 2021 года обещают второе поколение

Toyota Corolla

Теряет 13,9% цены за первые три года

Цена: от 1 359 000 Р

C-класс. Один из самых продаваемых автомобилей в мире. Модель выпускают с 1966 года. Сейчас продают Короллу 12-го поколения

Mazda CX-5

Теряет 10,5% цены за первые три года

Цена: от 1 792 000 Р

SUV C-класса. Появился на российском рынке в 2012 году. Современная CX-5 — второго поколения, собирают во Владивостоке с 2017

Toyota Camry

Теряет 13,1% цены за первые три года

Цена: от 1 992 000 Р

D-класс. Модель выпускают с 1982 года. Камри восьмого поколения собирают под Санкт-Петербургом

Kia Sorento

Теряет 11,6% цены за первые три года

Цена: от 2 364 900 Р

SUV D-класса. Модель выпускают с 2002 года. Соренто четвертого поколения собирают в Калининграде

Toyota Hilux

Теряет 12,5% цены за первые три года

Цена: от 2 651 000 Р

Пикап, выпускается с 1968 года. За все время сменилось 8 поколений. На Ближнем Востоке это самый распространенный автомобиль для боевых действий

Toyota Land Cruiser

Теряет 11,8% цены за первые три года

Цена: от 5 454 000 Р

SUV E-класса. Легендарная модель, выпускается дольше всех — с 1951 года. Есть много модификаций. Тойота не может подолгу не переделывать определенную модификацию Ленд Крузера и ограничиваться рестайлингом

BMW 5 Series

Теряет 22,4% цены за первые три года

Цена: от 3 199 000 Р

Е-класс. Модель производят с 1972 года, сейчас актуально седьмое поколение. Спортивная модификация «М» ценится на вторичке выше и дешевеет чуть медленнее

Lexus LX

Теряет 17,2% цены за первые три года

Цена: от 7 398 000 Р

SUV E-класса. Люксовая версия Ленд Крузера. Модель делают с 1996 года на основе разных модификаций Ленд Крузеров

Mercedes S-Klasse

Теряет 30,6% цены за первые три года

Цена: от 11 660 000 Р

F-класс. Люксовый легковой автомобиль, выпускается с 1954 года. Все передовые технологии Мерседес сначала появляются в S-классе и уже потом — в других моделях. Самая продаваемая модель в своем сегменте

Как быть в курсе новостей про автомобили

Читайте наш автодайджест — рассылку для тех, кто за рулем. Как купить или продать авто, не переплачивать за обслуживание и еще много всего полезного — только у нас

Цены взяли у официальных дилеров и на «Авто-ру», они действительны на момент публикации

Эти статьи будут полезны тем, кто хотел бы лучше разобраться в расходах на содержание автомобиля:

1. Калькулятор: сколько стоит машина в первые три года.
2. Я потеряла на покупке машины 377 000 Р за 10 месяцев.
3. Налог с продажи автомобиля.

Названы автомобили, которые не теряют в цене

Свежий номер

РГ-Неделя

Родина

Тематические приложения

Союз

Свежий номер

Рубрика:

Легковые авто

27. 02.2022 11:02

Александр Чупров

Эксперты назвали модели автомобилей, которые со временем можно будет продать с наибольшей выгодой. Как оказалось, наиболее ликвидными сегодня являются кроссоверы, несмотря на больший износ из-за интенсивного характера эксплуатации таких машин по внедорожью.

Максим Блинов/ РИА Новости

Автомобили как вино

Давно известно, что автомобиль теряет в цене сразу примерно 20%, как только покидает дилерский центр и продолжает «дешеветь» с каждым пройденным километром. Однако в условиях постоянного роста цен на авторынке в последнее время, подержанную машину можно продать сегодня даже дороже, чем она была куплена несколько лет назад. Это подтверждают результаты проведенного агентством «Автостат» исследования «Residual value — 2022», согласно которым у многих моделей, купленных в 2018 году, остаточная стоимость впервые превысила 100%.

По словам директора «Авилон. Автомобили с пробегом» Николая Баскакова, цены на автомобили с пробегом взаимосвязаны с рынком новых машин: если новые модели дорожают, то остаточная стоимость предложений с пробегом, как следствие, тоже повышается. Сегодня чаще всего прайсы обновляются в большую сторону на востребованные модели, где чувствуется нехватка новых автомобилей и увеличено время ожидания поставки из-за образовавшегося дефицита микрочипов. Когда дефицитные модели поступают на склады дилеров, рост цен на автомобили с пробегом приостанавливается. Как правило, у отличающихся своей надежностью моделей остаточная стоимость выше, дополнительно этот показатель зависит от стоимости обслуживания и сроков поставки запасных частей.

Как отмечает эксперт «Дрома» Мария Погребец, чем новее модель, тем выше вероятность, что через три года ее еще будут выпускать, а значит, и на вторичном рынке она будет цениться выше. Если рассматривать бюджетный сегмент, то лучше выбрать машину, которая по максимуму локализована в России, поскольку цены на запчасти будут дешевле, что опять же скажется на цене. Исключения здесь — Toyota, Mazda и некоторые модели «корейцев».

«Из-за дефицита и роста цен остаточная стоимость практически всех машин, купленных в 2018 году, превысила 100%. Также в прошлом году на эти автомобили наблюдался повышенный спрос. В 2021 году скорость продажи «трехлеток» увеличилась практически в два раза, а общее количество сделок с этими машинами выросло на 23% относительно 2020 года. Тем не менее, рассматривать покупку автомобиля в качестве вложения капитала не стоит, но если вы запланировали приобретение машины, то лучше поторопиться — цены будут расти», — советует Мария Погребец.

Мал золотник, да дорог

Сравнив стоимость нового автомобиля в 2018 году и цену при его перепродаже в 2021-м, аналитики «Автостата» рассчитали индексы остаточной стоимости 335 моделей легковых машин, представленных на российском рынке. Итак, в очередном рейтинге самых ликвидных моделей среди автомобилей В-класса лидером стал Kia Rio, чей индекс остаточной стоимости составил 106,7%.

Таким образом, он смог обойти по этому показателю Hyundai Solaris и Volkswagen Polo, которые не вошли в тройку лидеров. На втором месте в этой номинации остается Renault Sandero, (104,7%), а третью строчку данного рейтинга впервые занял Citroen C3 Aircross (104,4%), хотя его продажи в России совершенно незначительны. Стоит также отметить, что ни Lada Vesta, ни Granta, которые являются безусловными бестселлерами на российском авторынке, в свежий рейтинг самых ликвидных моделей не попали, хотя бюджетник Granta некогда даже лидировал по сохранности остаточной стоимости в своем классе.

Как считает генеральный директор сети автосалонов Fresh Auto Денис Мигаль, высокая остаточная стоимость таких моделей, как Kia Rio и Renault Sandero, объясняется их популярностью среди россиян как в сегменте новых, так и поддержанных машин. Кроме того, трехлетние автомобили на вторичном рынке на сегодняшний день — дефицит, что еще сильнее стимулирует их владельцев завышать цену при продаже. Также можно отметить высокую надежность этих иномарок, которая обеспечивает им постоянный спрос.

«Что касается Citroen C3 Aircross, он является нишевым автомобилем с оригинальным дизайном и возможностью персонификации, оснащен автоматической коробкой передач, а не вариатором или роботом. Поэтому для тех автомобилистов, кто предпочитает выделяться на проезжих частях России, французский кроссовер — оптимальный вариант», — констатирует Денис Мигаль.

Плата за качество

Фото: Пресс-служба Volkswagen.

В С-сегменте на первое место по сохранности остаточной стоимости вышел родоначальник класса Volkswagen Golf с показателем 108,8%. Таким образом, он опередил прошлогоднего победителя в этой номинации Toyota Corolla, чей результат составил 107,8%. Третий результат показал Kia Cerato — 103,5%, хотя на рынке новых автомобилей эта модель пользуется лучшим спросом, чем Volkswagen Golf и Toyota Corolla.

Как отмечает директор департамента автомобилей с пробегом ГК «АвтоСпецЦентр» Владимир Желобов, популярность Volkswagen Golf в России растет, несмотря на снижение спроса на автомобили С-класса в целом.

«Немецкий Volkswagen Golf в 2003 году стал прорывом бренда, собрав в себя все инновационные на тот момент технологии — платформу PQ35, мотор с непосредственным впрыском, преселективные коробки DSG и полный привод. В связи с этим он до сих пор считается одним из самых надежных автомобилей на российском рынке, а с учетом того, что в прошлом году у нас появилось новое поколение модели, «Гольф» стал настоящим эксклюзивом для потребителей и впоследствии будет достаточно желающих его приобрести. В свою очередь, немецкие и японские автомобили всегда имели высокую остаточную стоимость благодаря надежной сборке и качеству комплектующих — этим объясняется высокая остаточная стоимость Volkswagen Golf и Toyota Corolla», — рассуждает Денис Мигаль.

А вот Kia Cerato, по его мнению, несмотря на то, что пользуется большим спросом, имеет ряд недочетов, принципиальных при эксплуатации в российских условиях. Например, мягкие пружины, из-за которых авто проседает при загрузке, низкий дорожный просвет и недолговечное лакокрасочное покрытие. За ту же стоимость можно приобрести машину без этих проблем — ту же Toyota Corolla.

Среди седанов бизнес-класса первое место по сохранности остаточной стоимости сохраняет Toyota Camry, чей показатель составил 108%. Второй результат оказался на счету Mazda6 — 107,4%, а замыкает тройку лидеров Volkswagen Passat — за три года эксплуатации эта модель сохраняет 99,7% от своей первоначальной цены. Стоит отметить, что из рейтинга выпала Hyundai Sonata, хотя на рынке новых автомобилей эта модель продается успешнее, чем Mazda6 и Volkswagen Passat.

«Toyota Camry занимает первое место в своем классе, так как имеет репутацию надежного автомобиля, с которым не будет никаких проблем. И за счет высокой популярности машина очень ликвидна на вторичном рынке», — констатирует Мария Погребец.

В свою очередь, Денис Мигаль отмечает, что, как и в случае с гольф-классом, японские и немецкие автомобили всегда имели первые места в рейтинге надежности среди бизнес-седанов, а значит, меньше нуждались в ремонте, расходах на запчасти и спустя три-четыре года эксплуатации оставались в хорошем техническом состоянии. Поэтому в тройке лидеров по остаточной стоимости в этом сегменте находятся Toyota Camrу, Mazda6 и Volkswagen Passat.

Внедорожники всегда в цене

Что касается компактных кроссоверов, наилучший результат по сохранности остаточной стоимости по-прежнему у Hyundai Creta (112,7%), а второе место сохранил Renault Duster (106,3%). Впервые в рейтинг вошел Suzuki Jimny (105,5%), вытеснив из тройки лидеров Nissan Juke.

По мнению Владимира Желобова, Hyundai Creta удерживает лидерство по сохранности остаточной стоимости среди кроссоверов В-класса благодаря тому, что обслуживание этой модели обходится дешевле, чем конкурентов. К тому же данный кроссовер имеет хорошую управляемость благодаря крепкой подвеске, что обеспечивает ему долгий срок эксплуатации.

В сегменте SUV-C первое место по сохранности остаточной стоимости по-прежнему занимает Mazda CX-5 с показателем 112,3%. А вот на второй и третьей ступеньках пьедестала почета произошли изменения — Hyundai Tucson (107,2%) и Mitsubishi ASX (106,8%) смогли вытеснить из тройки лидеров Toyota RAV4 и Volkswagen Tiguan, которые на рынке новых автомобилей пользуются лучшим спросом.

Стоит также отметить, что в сегменте SUV средний индекс сохранности остаточной стоимости в целом несколько выше, чем у легковых моделей, несмотря на больший износ из-за интенсивного характера эксплуатации таких машин по внедорожью.

Как говорит Николай Баскаков, с учетом российских дорог внедорожники всегда в цене — на них традиционно более высокий спрос, и они выше ценятся на вторичном рынке. К тому же в нашей стране нет проблем с парковочными пространствами, как в европейских городах, где популярностью пользуются маленькие хэтчбэки.

«Кроссоверы за последние годы стали самыми востребованными автомобилями, поэтому сохраняют высокую ликвидность. Таким образом, приобретение автомобилей с высокой остаточной стоимостью — всегда выгодное вложение, особенно, когда цены на новые модели, а также на вторичном рынке регулярно увеличиваются», — резюмирует Владимир Желобов.

Главное сегодня

  • Путин отдельно поздравил с 8 Марта женщин-военнослужащих

  • Российские силы полностью взяли под контроль восточную часть Артемовска

  • Захарова: Понятно, почему США не в ЕС, у них закон об иноагентах действует с 1938 года

  • Reuters: Нефтяные сделки РФ и Индии подрывают многолетнее господство доллара в торговле

  • Южная Корея разрешила поставки гаубиц со своими деталями из Польши на Украину

  • Yle: жители востока Финляндии столкнулись с проблемами из-за разрыва связей с Россией

[Решено] Создать класс Vehicle. Входные данные: марка, модель, год, цена,.

..

Вопрос задан sdanhauser

Создать класс транспортных средств. Входные данные: марка, модель, год, цена и цвет в указанном порядке. Значения должны быть сохранены в экземпляре под этими именами. Для этих значений не должно существовать значений по умолчанию; они все должны быть востребованы.

Реализовать __repr__ и __str__ точно , как показано здесь: 

Текст транскрипции изображения

>>> от HW4 импортный автомобиль >>> car = Vehicle( «Nissan», «Versa», 2018, 25000, «Silver») > > > машина . делать «Ниссан» > > > машина . модель ‘Верса’ > > > машина . год 2018 >>> машина . цена 25000 > > > машина . цвет ‘Серебро’ > > > репр (автомобиль) ‘Автомобиль («Ниссан», «Верса», 2018, 25000, «Серебро») > > > машина Автомобиль («Ниссан», «Верса», 2018, 25000, «Серебро») > > > ул(машина) «Это серебристый Nissan Versa 2018 года стоимостью 25000» > > > печать (автомобиль) Это серебристый Nissan Versa 2018 года стоимостью 25000 9. 0003

… Показать больше

На данный момент у меня есть:

current_year = datetime.datetime.now().year

class Vehicle:

  «»»»Простой класс, представляющий транспортное средство»»»

  def __init__(self, make, model, year, price, color):

    self.make = make

    self.model = model

    self.year = year

    self.price = price

90 002. color = self color

  def current_value

  def __str__(self):

    возврат («Это {} {} {} {} стоимостью {}».format(self.year,self.color,self.make,self.model,self.price))

  def __repr__(self. ):

    return «Автомобиль(‘{}’, ‘{}’, {}, {}, ‘{}’)».format(self.make,self.model,self.year,self.price,self .color)

Затем мне нужно добавить свойство current_value, которое вычисляет и возвращает текущее значение транспортного средства, основанное на возрасте транспортного средства и этой совершенно произвольной формуле:

Используйте функцию datetime. now() , из которой Текущий_год извлекается, чтобы вы могли рассчитать возраст автомобиля. Поскольку транспортное средство теряет некоторую ценность сразу после покупки, рассчитайте возраст транспортного средства как текущий_год – self.year + 1. Если возраст автомобиля более 5 лет, то его текущая стоимость составляет 10% от цены. В противном случае его текущая стоимость равна цене минус 15% цены за каждый год возраста.

Текст транскрипции изображения

>>> марка, модель, цвет = ‘Toyota Camry White’.5plit() >>> car2 = Автомобиль (марка, модель, 2012 г., 30000,50, цвет) >>> car2 Автомобиль(«Toyota», «Camry», 2012, 30000.5, цвет) >>> car2.current_value 3000.05 >>> car3 = Автомобиль (марка, модель, 2020, 30000, цвет) >>> car3.current_value 25500.0 >>> car3 = Автомобиль (марка, модель, 2019 г., 30000, цвет) >>> car3.current_value 21000.0 >>> car3 = Автомобиль (марка, модель, 2018, 30000, цвет) >>> car3.

current_value 16500.0 >>> car3 = Автомобиль (марка, модель, 2017, 30000, цвет) >>> car3.current_value 12000.0 >>> car3 = Автомобиль (марка, модель, 2016, 30000, цвет) >>> car3.current_value 7500.0 >>> car3 = Автомобиль (марка, модель, 2015, 30000, цвет) >>> car3.current_value 3000.0 >>> car3 = Автомобиль (марка, модель, 2012, 30000, цвет) >>> car3.current_value 3000.0

… Показать больше

Затем добавьте проверку, чтобы убедиться, что:

1. Ввод года является целым числом

2. Цена является либо целым числом, либо числом с плавающей запятой

Вызовите TypeError, если одно из них не так. Подсказка: Используйте встроенную функцию isinstance(). classinfo может быть тестируемым кортежем более чем одного типа; isinstance вернет True, если объект относится к одному из типов в

classinfo .

Сообщения должны выглядеть так:

>>> марка, модель, цвет = ‘Toyota Camry White’. split() >>> car3 = Автомобиль (марка, модель, 201.2, 30000, цвет) Отслеживание (последний последний вызов):

[.. .]

TypeError: год ввода должен быть целым числом!

>>> car3 = Транспортное средство (марка, модель, 2012 г., цвет, цвет) Отслеживание (последний последний звонок):

[…]

TypeError: Входная цена должна быть числом! >>>

Примечание: […] представляет информацию о трассировке, которая не всегда одинакова на разных компьютерах.

Вот что у меня есть:

current_year = datetime.datetime.now().year

class Vehicle:

  «»»Простой класс, представляющий транспортное средство»»»

  def __init__(self, make , модель, год, цена, цвет):

    self.make = make

    self.model = модель

    self.year = год

    self.price = цена

_ текущее значение 9000 efcolor0

3 = цвет

3

  def __str__(сам):

    return («Это {} {} {} {} стоимостью {}».format(self. year,self.color,self.make,self.model,self.price))

  def __repr__(self) :

    return «Автомобиль(‘{}’, ‘{}’, {}, {}, ‘{}’)».format(self.make,self.model,self.year,self.price,self. цвет)

Информатика Инженерная технология Программирование на Python

Ответ и объяснение

Решено проверенным экспертом

Рейтинг Полезно

Ответил leezasethi07

gue vel laoreet a

  1. facilisis. Pellentesque dapibus efficitur laoreet
  2. ur laoreet. Nam risus ante, dapibus a molestie consequat, u

consectetur adipiscing elit. Нам ла

, dictum vitae odio. Донец Аликет. Lorem ipsum dolor sit amet, consectetur adipiscing elit. Нам Лачин

Получите полный доступ к Course Hero

Изучите более 16 миллионов пошаговых ответов из нашей библиотеки

Подпишитесь, чтобы посмотреть ответ

Пошаговое объяснение isciirem ifor neipiscing elit. Nam lacinia pulvinar tortoror netiusce duxac, m risus ante, dapibus a molestieur laoreet.cingsus ante, dapibus a mocingonec aliquet. Lorem ipsucinga molestie consequat, cingipsum dolor sit amet, cocingctum vitae odio. Donec aulsusus ante, dapibus a molestie consequat, ulsus ante, dapibus a molestie consequat, um ipsum dolor sit amet, consulsuitur laoreet. Nam risus aicat, ultrices ac magna. Fusce dui lectus, congutesque dapibus efficitur laoreet. Nam risuscongue vel laoreet ac, dictucings ante, dapibus acingur laoreet. Nam risusatiacinia pulvxac,titur laoreet. Nam risus ante, dapibus a molestie consequat, ultrices ac magna. Fusccingur laoreefonec aliqullentesq,ctum vitae odior nel0uf,cingusce dui lectusnecFusce dui nelcinga molestie conseqcinginia p0usuonec aliqatiusce duxac,tur laoreet.or neDitur laoreet. Nam risus ante, dapictum vitcinginia pcingrem ipcingec faccingonec alcingec facilisis. Peatipulvinxac, tur laoreet.or nela. Fusce dui lectus, congue vel laoctum vitcingec faccingonec alcinginia pcingiciturcingicitur l

элитный элитный

элитный элитный.

Lorem ipsum dolor sit a

, dictum vitae odio. Донец Аликет. Lorem ipsum dolor sit amet, consectetur adipiscing elit. NAM Lacinia Pulvinar T

Конга Vel Laoreet AC, D

A Rolestie

7 1 Приложение

PNG

Отзывы студентов

100% (2 оценки)

Советы и рекомендации по построению модели оценки цен на подержанные автомобили | Тобиа Альбергони

Проблемы и решения для создания надежной модели прогнозирования цен на автомобили с помощью машинного обучения

Фото Кэмпбелла на Unsplash

Недавно я опубликовал короткую статью на Medium, в которой представил мотивы, цели и проблемы, которые побудил команду ELCA Data Science разработать модель машинного обучения (ML) для точной оценки цен на подержанные автомобили на швейцарском рынке. Задача прогнозирования цен всегда привлекала значительное внимание сообщества машинного обучения, а появление онлайн-рынков для всех видов подержанных объектов увеличило потребность в автоматизированных инструментах для точного прогнозирования разумных ценников.

В этой заметке я кратко представлю архитектуру нашей модели, а также некоторые стратегии, которые мы использовали для решения следующих ключевых задач:

  • Как обрабатывать и кодировать категориальные переменные up для недостаточное количество выборок данных для моделей автомобилей
  • Как реализовать подход обнаружения выбросов для защиты нашего учебного процесса от зашумленных данных.

В частности, наш Решение для межрыночного внедрения сущностей — это подход с переносом обучения , который повышает точность прогнозирования нашей модели примерно на 4,3% .

Мы работали с тремя различными наборами данных об автомобилях, состоящими из объявлений о продаже автомобилей с различных швейцарских и европейских цифровых торговых площадок.

  • Набор данных AutoScout24-CH содержит 119 414 объявлений и использовался для обучения и проверки.
  • AutoScout24-DE — это набор из 558 295 объявлений о распродажах в Германии (взято из европейской версии сайта). Этот больший набор данных используется для нашего подхода к трансфертному обучению.
  • Третий швейцарский набор данных ( Comparis-CH , 111 972 образца) используется в качестве тестового набора для оценки обобщения модели

Мы ограничиваемся небольшим и простым набором характеристик автомобилей, известных широкой публике и легко собрать для большинства подержанных автомобилей.

Набор функций, которые мы использовали в качестве нашего подхода к моделированию автомобилей. Изображение автора.

Цель состоит в том, чтобы выполнить стандартную задачу регрессии с этим набором функций, в которой целевое количество — это продажная цена y_n автомобиля x_n в швейцарских франках (CHF), разделенная на среднюю цену соответствующего автомобиля. модель в обучающем наборе.

Эта простая манипуляция делает цели относительной величиной и стабилизирует процесс оптимизации. Ориентировочные цены в швейцарских франках получаются путем простого уменьшения прогноза. Среднеквадратичная ошибка r ( RMSE ) — функция потерь по выбору. Мы сообщаем об этом относительно исходных целей в швейцарских франках по соображениям интерпретируемости.

Мы определили и утвердили регрессор XGBoost как лучшую модель для нашего конвейера прогнозирования. XGBoost — это популярный и мощный фреймворк, реализующий метод с усилением градиента . По своей сути это ансамблевый метод , который объединяет деревья слабых решений. Все эксперименты по поиску и оптимизации модели проводились в соответствии со стандартными процедурами машинного обучения с 10-кратная стратифицированная перекрестная проверка на наборе данных AutoScout24-CH . На рисунке ниже показан окончательный конвейер прогнозирования.

Наш конвейер прогнозирования цен. Изображение автора.

Признаки производителя ( производитель ) и модели автомобиля ( модель ) кодируют большую часть доступной информации о ценовом классе нового автомобиля. Наборы данных содержат 37 различных производителей автомобилей и 211 моделей автомобилей. Поскольку это категориальных признаков (в отличие от непрерывных), нам нужно закодировать их, прежде чем мы сможем объединить их с оставшимися функциями и использовать их для обучения модели. Самый простой подход к кодированию — это стандартная схема one-hot , где мы создаем столько бинарных переменных, сколько классов в каждом поле. Этот метод почти эквивалентен обучению различных моделей регрессии для каждого класса. Учитывая, что данных по многим моделям автомобилей мало, этой схемы кодирования недостаточно. Метод, отображающий переменные в единое непрерывное пространство, предпочтительнее, так как он позволит модели использовать сходства между классами.

Простой выбор представления, который достигает этой цели, состоит в том, чтобы представить категориальные переменные с двумя непрерывными значениями каждая: средняя цена класса в обучающих данных и ее стандартное отклонение. Интуитивно этот метод кодирования обогащает вектор представления автомобиля приблизительной информацией о стартовой цене и диапазоне амортизации. Тем не менее, он не дает возможности узнать более подробные сведения о характере амортизации для каждого класса автомобилей.

Подход Entity Embedding (EE), предложенный C. Guo и F. Berkhan в 2016 г. и показанный на схеме ниже, представляет собой более сложный метод, в котором используется небольшая нейронная сеть для изучения сопоставления с одним горячим представления каждой переменной к скрытому представлению. Это отображение представлено кодированием уровня EE для каждой переменной, веса которой обучаются вместе с остальной частью модели в отношении задачи прогнозирования цены.

Иллюстрация слоев внедрения сущностей (EE), которые соответствуют дополнительным слоям поверх каждого входного сигнала с горячим кодированием. Изображение от К. Го и Ф. Беркан .

Три подхода к кодированию обеспечивают следующие средние характеристики проверки. Замена переменной средней ценой класса и стандартным отклонением немного превосходит подход EE.

Отсутствие достаточного количества выборок данных для некоторых моделей автомобилей может объяснить неутешительные результаты метода ЭЭ. Некоторые модели встречаются менее 100 раз в AutoScout24-CH , что не позволяет изучить достаточно точные сопоставления. Поэтому мы обучаем сеть EE на более крупных AutoScout24-DE датасет, так как на немецком автомобильном рынке представлен дистрибутив, аналогичный швейцарскому. Следовательно, относительные расстояния классов автомобилей в скрытом пространстве EE должны быть переносимыми .

Наш межрыночный подход к внедрению сущностей для решения проблемы нехватки данных. Слои кодирования EE обучаются на немецких данных, а затем переносятся в нашу швейцарскую модель. Изображение автора.

Этот подход к межрыночному трансфертному обучению обеспечивает прирост производительности примерно в 9 раз.0049 4,3% на швейцарской RMSE, что делает подход EE превосходящим другие схемы кодирования:

Дальнейший анализ наборов данных позволил нам понять, что объявления о распродажах не всегда могут быть надежной достоверной информацией о ценах. Нет никакого контроля или ограничения на неточность указанного ценника, тем более, что мы не учитываем автомобильные аксессуары и многие другие важные функции автомобиля. Существует явная необходимость «видеть сквозь шум» и обучать модель только на образцах, которые придерживаются общая тенденция ценообразования для каждого производителя/модели автомобиля.

Наше решение заключается в применении довольно агрессивной процедуры удаления выбросов для каждой модели автомобиля отдельно. Мы выполняем обнаружение выбросов на основе плотности в трех отдельных двумерных подпространствах пространства характеристик-целей: Цена-Пробег , Цена-Возраст, и Цена-Мощность. Пробег и возраст — два индикатора уровня износа и две основные причины износа. Мы также обнаружили значительный набор образцов, для которых цена аномально высока по отношению к указанному классу мощности. Если образец обнаруживается как выброс в любой из трех плоскостей, он удаляется из набора данных. Мы используем алгоритм Local Outlier Factor (LOF) для поиска аномальных точек данных путем измерения отклонения их локальной плотности по отношению к соседям. Следующая схема поясняет этот подход:

Предлагаемый подход к обнаружению выбросов, основанный на методе локального фактора выбросов (LOF), применяется к трем различным подпространствам объектов-целей. Изображение автора.

Мы удаляем примерно 12,5% обучающих данных и обучаем всю модель на новых наборах данных (включая немецкие слои EE). Это приводит к следующему значительному повышению производительности:

Мы сообщаем об окончательной валидации/тестировании RMSE и Средней абсолютной ошибке (MAE) нашей модели машинного обучения, рассчитанной для всех моделей автомобилей. Для подавляющего большинства автомобилей средняя ошибка оценки составляет менее 20% вариации цены для данной конкретной модели автомобиля в обучающих данных. Учитывая относительную простоту нашего подхода к моделированию автомобилей, производительность нашего подхода более чем удовлетворительна.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *