Tag Archives: etl

Хозяйке на заметку: PDI, очистка кэша БД

Делаю проект на Pentaho Data Integrator. Столкнулся с такой фичей, как кэш описания таблиц в БД. Т.е. ты тип колонки меняешь, а PDI все еще «видит» старый и ругается. Решается очисткой кэша, который неинтуитивно запускается через Explorer трансформации. Правой кнопкой на базе и Refresh Cache. Однако чем хорош open-source — все уже можно найти, иначе [...]

Мелочь, а приятно

За что люблю  Oracle, так это за обычную ситуацию, когда тебе нужна какая-то стандартная функция, а она — бац, и уже есть. Тренд не считается ) Вот нужно посчитать расстояние Левенштейна, есть utl_match.edit_distance. Там есть даже Jaro-Winkler. Понятно что это самое начало, но для примерной оценки «чистоты» справочника полезно. Но, как водится, Oracle нужен на [...]